欢迎来到 Python 基础入门 Day08!在前几天的学习中,我们已经掌握了 Python 的基本语法、数据结构、函数与模块、文件操作、异常处理、面向对象编程,以及常用内置模块和正则表达式。如果你还没有学习之前的内容,可以通过以下链接进行复习:
- Python 基础入门 Day01
- Python 基础入门 Day02
- Python 基础入门 Day03
- Python 基础入门 Day04
- Python 基础入门 Day05
- Python 基础入门 Day06
- Python 基础入门 Day07
今天,我们将学习 Python 的数据可视化工具。数据可视化是展示数据分析结果的有力工具,可以帮助我们直观地理解数据。我们将重点介绍 matplotlib 和 pandas 两个常用的 Python 库。
目录
- 数据可视化简介
matplotlib
基础pandas
数据处理与可视化- 综合实例:绘制多种图表
- 小结与练习
一、数据可视化简介
数据可视化是将数据转化为图表的过程,通过视觉化手段揭示数据中的规律和趋势。Python 提供了多个强大的可视化库,其中最常用的是 matplotlib 和 pandas 的内置绘图功能。
二、matplotlib
基础
matplotlib
是 Python 最基础的绘图库,可以创建各种静态、交互式和动画图表。
2.1 安装 matplotlib
在使用前,确保已安装 matplotlib
:
pip install matplotlib
2.2 绘制简单的折线图
import matplotlib.pyplot as plt
# 数据
x = [1, 2, 3, 4, 5]
y = [10, 15, 13, 18, 16]
# 绘制折线图
plt.plot(x, y, marker='o')
plt.title('简单折线图')
plt.xlabel('X 轴')
plt.ylabel('Y 轴')
plt.grid(True)
plt.show()
2.3 绘制柱状图
# 数据
categories = ['A', 'B', 'C', 'D']
values = [4, 7, 1, 8]
# 绘制柱状图
plt.bar(categories, values, color='skyblue')
plt.title('简单柱状图')
plt.xlabel('类别')
plt.ylabel('值')
plt.show()
三、pandas
数据处理与可视化
pandas
是 Python 最常用的数据分析库,自带强大的数据处理和可视化功能。
3.1 安装 pandas
pip install pandas
3.2 使用 pandas
读取 CSV 文件
import pandas as pd
# 读取 CSV 文件
df = pd.read_csv('data.csv')
print(df.head())
3.3 使用 pandas
绘制折线图
# 生成示例数据
data = {'Year': [2018, 2019, 2020, 2021, 2022],
'Sales': [100, 150, 200, 250, 300]}
df = pd.DataFrame(data)
# 绘制折线图
df.plot(x='Year', y='Sales', kind='line', marker='o', title='年度销售额')
plt.show()
3.4 使用 pandas
绘制饼图
# 绘制饼图
df.plot(kind='pie', y='Sales', labels=df['Year'], autopct='%1.1f%%', title='销售占比')
plt.ylabel('') # 移除 y 轴标签
plt.show()
四、综合实例:绘制多种图表
我们来综合运用 matplotlib
和 pandas
绘制多种图表,展示数据的多样性。
4.1 绘制多条折线图
import matplotlib.pyplot as plt
import pandas as pd
# 创建数据
data = {
'Month': ['Jan', 'Feb', 'Mar', 'Apr', 'May'],
'Product A': [30, 35, 40, 50, 45],
'Product B': [20, 25, 30, 35, 30]
}
df = pd.DataFrame(data)
# 绘制多条折线图
plt.plot(df['Month'], df['Product A'], marker='o', label='Product A')
plt.plot(df['Month'], df['Product B'], marker='s', label='Product B')
plt.title('产品月销售趋势')
plt.xlabel('月份')
plt.ylabel('销售额')
plt.legend()
plt.grid(True)
plt.show()
4.2 绘制散点图
# 生成随机数据
import numpy as np
x = np.random.rand(50)
y = np.random.rand(50)
# 绘制散点图
plt.scatter(x, y, color='purple')
plt.title('随机散点图')
plt.xlabel('X 轴')
plt.ylabel('Y 轴')
plt.show()
五、小结与练习
今天我们学习了 Python 的数据可视化工具,重点介绍了 matplotlib
和 pandas
的使用。数据可视化能帮助我们更直观地分析和展示数据。
今日练习题:
- 使用
matplotlib
绘制一条表示气温变化的折线图,X 轴为日期,Y 轴为气温。 - 使用
pandas
读取一个 CSV 文件,并绘制相应的柱状图。 - 使用
matplotlib
绘制一个包含多个类别的堆叠柱状图。 - 使用
pandas
绘制一个散点图,展示两组数据之间的关系。
下一节预告:在 Day09 中,我们将学习 Python 的高级特性,包括生成器、装饰器和上下文管理器,敬请期待!
Pingback: Python 基础入门 Day10 - Nas 的天空
Pingback: Python 基础入门 Day12 - Nas 的天空