Python 基础入门 Day08

Python 基础入门 Day08

欢迎来到 Python 基础入门 Day08!在前几天的学习中,我们已经掌握了 Python 的基本语法、数据结构、函数与模块、文件操作、异常处理、面向对象编程,以及常用内置模块和正则表达式。如果你还没有学习之前的内容,可以通过以下链接进行复习:

今天,我们将学习 Python 的数据可视化工具。数据可视化是展示数据分析结果的有力工具,可以帮助我们直观地理解数据。我们将重点介绍 matplotlibpandas 两个常用的 Python 库。

目录

  1. 数据可视化简介
  2. matplotlib 基础
  3. pandas 数据处理与可视化
  4. 综合实例:绘制多种图表
  5. 小结与练习

一、数据可视化简介

数据可视化是将数据转化为图表的过程,通过视觉化手段揭示数据中的规律和趋势。Python 提供了多个强大的可视化库,其中最常用的是 matplotlibpandas 的内置绘图功能。


二、matplotlib 基础

matplotlib 是 Python 最基础的绘图库,可以创建各种静态、交互式和动画图表。

2.1 安装 matplotlib

在使用前,确保已安装 matplotlib

pip install matplotlib

2.2 绘制简单的折线图

import matplotlib.pyplot as plt # 数据 x = [1, 2, 3, 4, 5] y = [10, 15, 13, 18, 16] # 绘制折线图 plt.plot(x, y, marker='o') plt.title('简单折线图') plt.xlabel('X 轴') plt.ylabel('Y 轴') plt.grid(True) plt.show()

2.3 绘制柱状图

# 数据 categories = ['A', 'B', 'C', 'D'] values = [4, 7, 1, 8] # 绘制柱状图 plt.bar(categories, values, color='skyblue') plt.title('简单柱状图') plt.xlabel('类别') plt.ylabel('值') plt.show()


三、pandas 数据处理与可视化

pandas 是 Python 最常用的数据分析库,自带强大的数据处理和可视化功能。

3.1 安装 pandas

pip install pandas

3.2 使用 pandas 读取 CSV 文件

import pandas as pd # 读取 CSV 文件 df = pd.read_csv('data.csv') print(df.head())

3.3 使用 pandas 绘制折线图

# 生成示例数据 data = {'Year': [2018, 2019, 2020, 2021, 2022], 'Sales': [100, 150, 200, 250, 300]} df = pd.DataFrame(data) # 绘制折线图 df.plot(x='Year', y='Sales', kind='line', marker='o', title='年度销售额') plt.show()

3.4 使用 pandas 绘制饼图

# 绘制饼图 df.plot(kind='pie', y='Sales', labels=df['Year'], autopct='%1.1f%%', title='销售占比') plt.ylabel('') # 移除 y 轴标签 plt.show()


四、综合实例:绘制多种图表

我们来综合运用 matplotlibpandas 绘制多种图表,展示数据的多样性。

4.1 绘制多条折线图

import matplotlib.pyplot as plt import pandas as pd # 创建数据 data = { 'Month': ['Jan', 'Feb', 'Mar', 'Apr', 'May'], 'Product A': [30, 35, 40, 50, 45], 'Product B': [20, 25, 30, 35, 30] } df = pd.DataFrame(data) # 绘制多条折线图 plt.plot(df['Month'], df['Product A'], marker='o', label='Product A') plt.plot(df['Month'], df['Product B'], marker='s', label='Product B') plt.title('产品月销售趋势') plt.xlabel('月份') plt.ylabel('销售额') plt.legend() plt.grid(True) plt.show()

4.2 绘制散点图

# 生成随机数据 import numpy as np x = np.random.rand(50) y = np.random.rand(50) # 绘制散点图 plt.scatter(x, y, color='purple') plt.title('随机散点图') plt.xlabel('X 轴') plt.ylabel('Y 轴') plt.show()


五、小结与练习

今天我们学习了 Python 的数据可视化工具,重点介绍了 matplotlibpandas 的使用。数据可视化能帮助我们更直观地分析和展示数据。

今日练习题:

  1. 使用 matplotlib 绘制一条表示气温变化的折线图,X 轴为日期,Y 轴为气温。
  2. 使用 pandas 读取一个 CSV 文件,并绘制相应的柱状图。
  3. 使用 matplotlib 绘制一个包含多个类别的堆叠柱状图。
  4. 使用 pandas 绘制一个散点图,展示两组数据之间的关系。

下一节预告:在 Day09 中,我们将学习 Python 的高级特性,包括生成器、装饰器和上下文管理器,敬请期待!


2 Comments

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注