Python 数据可视化实战：如何从文本文件中读取数据并绘制专业图表

2026-02-08 00:40:30 0条评论 72次阅读 0人点赞

在日常的数据分析或开发工作中，我们经常会遇到需要从外部文件读取数据并进行可视化的情况。虽然数据库和 CSV 文件非常常见，但简单的文本文件（.txt）因其轻量和易于生成的特性，依然广泛用于存储日志记录、配置数据和简单的实验结果。

你是否曾想过，如何利用 Python 强大的数据处理能力，将那些枯燥的文本行转化为直观的柱状图、折线图或饼图？在这篇文章中，我们将深入探讨如何利用 Python 中最流行的可视化库——Matplotlib，配合内置的文件操作功能，从零开始创建各种类型的图表。

我们将不仅停留在“画出来”这一步，还会一起探讨代码背后的逻辑、常见的数据清洗细节以及如何让图表看起来更加专业。准备好你的数据，让我们开始这段探索之旅吧！

1 核心概念与准备工作
2 实战案例 1：构建学生成绩柱状图
3 实战案例 2：绘制项目贡献比例饼图
4 实战案例 3：绘制趋势折线图
5 进阶：处理复杂数据与 CSV 格式
6 常见错误与解决方案
7 总结

核心概念与准备工作

在动手写代码之前，我们需要明确一点：Matplotlib 本身并不直接“理解”文本文件。它的工作是接收列表、数组或字典等 Python 对象并将其转换为图形。因此，我们的核心任务可以分为两个步骤：

数据提取：使用 Python 的文件 I/O 功能（如 INLINECODE6a5709e3 函数）读取 INLINECODE26715727 文件，并利用字符串处理方法（如 split()）将原始文本转换为结构化的列表。
数据可视化：将处理好的列表传递给 Matplotlib 的绘图函数（如 INLINECODEb3070d1c, INLINECODE619c7d6f）。

前置准备：

在运行后续的代码之前，请确保你的环境中已经安装了 Matplotlib 库。如果尚未安装，可以在终端或命令行中运行以下命令：

pip install matplotlib

此外，为了方便演示，你需要准备几个扩展名为 .txt 的文本文件。我们将通过三个具体的实战案例，由浅入深地掌握这一技能。

实战案例 1：构建学生成绩柱状图

柱状图是最适合用于比较不同类别数据（例如不同人的成绩）的图表。

场景描述

假设我们有一个名为 sample.txt 的文件，其中记录了学生的姓名和某门课的对应成绩。数据格式非常简单：姓名和分数之间用空格分隔。

文件内容示例 (sample.txt)：

John 85
Alice 92
Bob 78
David 65
Eva 88

实现思路

为了画出这个图，我们需要将“姓名”作为 X 轴的数据，“分数”作为 Y 轴的数据。这意味着我们需要创建两个独立的列表：INLINECODEf5351ccf 和 INLINECODEd17eb11f。

我们可以这样设计流程：

导入库：引入 matplotlib.pyplot 模块，这是绘图的核心。
初始化列表：创建两个空列表用于存放数据。
读取文件：使用 INLINECODE677854b9 函数以只读模式（INLINECODE5d6a81ad）打开文件。
解析数据：遍历文件的每一行，利用 INLINECODE1c141911 方法按空格切割字符串。索引 INLINECODE70228092 是姓名，索引 INLINECODE3279757f 是分数（注意：分数需要从字符串转换为整数 INLINECODE3308bf66）。
绘图：调用 plt.bar() 函数，并设置图表的标题和坐标轴标签。

代码实现

import matplotlib.pyplot as plt

# 初始化两个空列表，分别用来存放姓名和分数
names = []
marks = []

# 打开文件进行读取
# ‘r‘ 代表只读模式
try:
    with open(‘sample.txt‘, ‘r‘) as f:
        for row in f:
            # 去除行首尾的空白字符（如换行符），并按空格分割
            parts = row.strip().split(‘ ‘)
            
            # 简单的错误处理，确保这行有两个数据
            if len(parts) == 2:
                names.append(parts[0])
                # 将分数部分转换为整数
                marks.append(int(parts[1]))
            else:
                print(f"跳过格式错误的行: {row}")

except FileNotFoundError:
    print("错误：找不到 sample.txt 文件，请检查路径。")
    exit()

# 开始绘图
plt.figure(figsize=(10, 6)) # 设置画布大小，让图表更清晰

# 绘制柱状图
# x: 姓名, height: 分数, color: 柱子颜色, label: 图例标签
plt.bar(names, marks, color=‘green‘, label=‘学生成绩‘)

# 添加图表信息
plt.xlabel(‘学生姓名‘, fontsize=12)
plt.ylabel(‘考试分数‘, fontsize=12)
plt.title(‘学生成绩分布图‘, fontsize=20)
plt.legend() # 显示图例

# 显示网格线，便于比较数值
plt.grid(axis=‘y‘, linestyle=‘--‘, alpha=0.7)

plt.show() # 弹出窗口展示图表

深度解析

在这段代码中，我们使用了一个 INLINECODE881c7d6a 块。这是实际开发中的最佳实践，因为如果文件路径错误或者文件不存在，程序会直接崩溃并抛出红色的错误堆栈。通过捕获 INLINECODEf36da4e6，我们可以给用户一个更友好的提示。

此外，请注意 INLINECODEe44dbbab 这一行。文本文件中经常隐藏着看不见的换行符 INLINECODE22d68cfb。如果不使用 INLINECODEce1edf64，最后一列数据（比如分数）可能会被读取成 INLINECODE22beb2d0，导致 int() 转换失败。这是一个初学者常踩的坑，务必小心。

实战案例 2：绘制项目贡献比例饼图

饼图通常用于展示部分占总体的比例关系。在这个例子中，数据的格式会稍微复杂一点，包含百分号。

场景描述

我们有一个记录团队成员工作量的文本文件 work_data.txt。每一行包含员工姓名和他们的工作贡献百分比。

文件内容示例 (work_data.txt)：

Alice 35%
Bob 25%
Charlie 20%
David 15%
Eve 5%

实现思路

这里最大的挑战在于处理数据中的 INLINECODEa7cdeb74 符号。Matplotlib 的 INLINECODE23512136 函数需要的是纯数值（如 35, 25），而不能直接处理字符串 ‘35%‘。

我们需要做的关键步骤是：

读取并分割数据。
获取第二列数据（如 ‘35%‘）。
使用字符串切片或替换方法去除 INLINECODEb6bf7b56，将其转换为浮点数 INLINECODE30858d3f。

代码实现

import matplotlib.pyplot as plt

employees = []
work_contributions = []

# 打开文件
with open(‘work_data.txt‘, ‘r‘) as f:
    for line in f:
        # 按空格分割行数据
        data = line.split()
        
        # data[0] 是名字, data[1] 是带百分号的数值
        if len(data) == 2:
            employees.append(data[0])
            
            # 去除 ‘%‘ 符号并转换为浮点数
            # 这里使用 replace 方法，也可以用 data[1][:-1] 切片
            clean_value = data[1].replace(‘%‘, ‘‘)
            work_contributions.append(float(clean_value))

# 定义颜色列表，让饼图更美观
colors = [‘yellowgreen‘, ‘lightblue‘, ‘pink‘, ‘gold‘, ‘red‘]

# 爆炸效果，突出显示贡献最大的人 (对应的值越大，离中心越远)
# 0.1 表示偏离中心 10% 的距离
explode = (0.1, 0, 0, 0, 0) 

# 绘制饼图
plt.figure(figsize=(8, 8))
plt.pie(work_contributions, 
        labels=employees, 
        colors=colors, 
        startangle=90,    # 起始角度，90度意味着从正上方开始
        shadow=True,      # 添加阴影效果
        radius=1.2,       # 饼图半径
        explode=explode,  # 应用爆炸效果
        autopct=‘%1.1f%%‘) # 自动在图表上显示百分比标签，保留一位小数

plt.title(‘团队成员项目工作贡献分布‘, fontsize=16)
plt.show()

深度解析

在这个例子中，我们使用了 INLINECODE41dfc5df 参数。这是一个非常实用的格式化字符串，它能自动计算并在饼图扇区上显示百分比。其中的 INLINECODE9c32e3ee 是 Python 字符串格式化中输出百分号字面量的方式。

我们还引入了 explode 参数。这种“爆炸饼图”效果在商业演示中非常常用，用于引导观众的视线聚焦在最重要的数据切片上。你可以通过调整元组中的数值来控制每个切片偏移中心的距离。

实战案例 3：绘制趋势折线图

折线图最适合观察数据随时间或序列变化的趋势。

场景描述

假设我们有一个文本文件 marks_trend.txt，记录了学生学号（Roll Number）和他们在某次测验中的连续表现。

文件内容示例 (marks_trend.txt)：

实现思路

对于折线图，我们通常希望 X 轴的刻度（这里是学号）能清晰显示。虽然 Matplotlib 默认会处理数字，但我们可以通过 INLINECODE14bf5bb8 或 INLINECODE3776f4a2 来手动干预刻度的显示方式，或者直接使用标记点来突出每个数据点的具体位置。

代码实现

import matplotlib.pyplot as plt

roll_numbers = []
marks = []

with open(‘marks_trend.txt‘, ‘r‘) as f:
    for line in f:
        # 分割每一行
        parts = [item for item in line.split()]
        
        if len(parts) >= 2:
            roll_numbers.append(parts[0])
            # 再次强调转换为整数，否则会按字符串排序导致错误
            marks.append(int(parts[1]))

# 设置图表大小
plt.figure(figsize=(10, 6))

# 绘制折线图
# marker=‘o‘ 表示用圆形标记数据点, c=‘g‘ 表示颜色为绿色
plt.plot(roll_numbers, marks, marker=‘o‘, c=‘g‘, linestyle=‘-‘, linewidth=2, markersize=8)

# 设置标题和标签
plt.title("学生成绩趋势图", fontsize=20)
plt.xlabel(‘学号‘, fontsize=12)
plt.ylabel(‘分数‘, fontsize=12)

# 优化：设置 Y 轴刻度，使其显示所有出现的分数值，或者使用默认值
# plt.yticks(marks) # 如果数据点太多，这行代码会让刻度重叠，建议仅用于少量数据

# 添加网格，方便查看具体数值对应的 Y 轴高度
plt.grid(True, linestyle=‘--‘, alpha=0.6)

plt.show()

深度解析

在 INLINECODEe2d73ea8 函数中，我们组合使用了 INLINECODE3a0eebd8、INLINECODE7a659445 和 INLINECODE00c2e753。这种组合是专业图表的标配：

marker (‘o‘)：即使不连线，你也能看到数据在哪里。
linewidth (2)：默认的线条通常比较细，稍微加粗一点会让图表在投影仪或论文中更清晰。
Grid：网格线是辅助阅读的关键，特别是在趋势图中，它能帮助观察者快速对准 X 轴和 Y 轴的数值。

进阶：处理复杂数据与 CSV 格式

虽然上述例子中使用的是空格分隔的 INLINECODE60ce5ab6 文件，但在实际工作中，数据往往更加杂乱，或者使用逗号分隔（CSV）。如果你的文本文件包含逗号（例如 INLINECODE4554ad16），你只需要将代码中的 INLINECODE3bac786a 修改为 INLINECODEa5cb5d84 即可。

最佳实践提示：

如果你的数据量非常大（例如成千上万行），使用 Python 原生的列表循环可能会变慢。这时，我们可以引入 INLINECODE54474686 库中的 INLINECODEa2d02dc6 函数，它能极快地加载文本数据。

import numpy as np
import matplotlib.pyplot as plt

# 使用 numpy 直接加载，跳过第一行如果是表头
# delimiter 指定分隔符，usecols 指定读取哪几列
data = np.loadtxt("large_data.txt", delimiter=" ", dtype=str) 

# 后续处理...

不过，对于初学者和中小规模的数据处理，掌握原生的 INLINECODE35878b82 和 INLINECODE68056857 方法至关重要，因为它不依赖额外的第三方库，能让你更深刻地理解数据流的处理逻辑。

常见错误与解决方案

在与文件和图表打交道的过程中，你可能会遇到以下几个常见问题：

UnicodeDecodeError：

* 原因：文本文件的编码格式不是默认的 UTF-8，可能是 GBK（常见于中文 Windows 系统生成的文件）。

* 解决：在 INLINECODE1791824f 函数中指定编码：INLINECODE4849199d 或 encoding=‘gbk‘。

ValueError: could not convert string to float：

* 原因：数据列中混入了空字符串或非数字字符。

* 解决：在转换前添加检查逻辑，或者使用 try-except 捕获转换错误并打印出那一行数据，方便你修正源文件。

中文显示乱码（方框）：

* 原因：Matplotlib 默认字体不支持中文。

* 解决：需要配置 Matplotlib 的字体属性。

    plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘] # 用来正常显示中文标签
    plt.rcParams[‘axes.unicode_minus‘] = False # 用来正常显示负号

总结

通过这篇文章，我们一起走过了从简单的文本文件到专业数据图表的完整流程。我们不仅学会了如何使用 INLINECODE144e46de 和 INLINECODE3c715aed 读取数据，还掌握了绘制柱状图、饼图和折线图的具体参数设置。

掌握这些基础技能后，你可以尝试将 Python 脚本与自动化任务结合。例如，编写一个每天自动运行的脚本，读取服务器生成的日志文本文件，生成性能趋势图并发送给你的邮箱。

数据可视化不仅仅是画图，更是讲述数据背后的故事。希望你能利用这些工具，从你的文本文件中发掘出有价值的信息！如果你在尝试过程中遇到任何问题，不妨多检查一下数据源的格式，那往往是问题所在。祝你在数据探索的道路上越走越远！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

Python 数据可视化实战：如何从文本文件中读取数据并绘制专业图表

核心概念与准备工作

实战案例 1：构建学生成绩柱状图

场景描述

实现思路

代码实现

深度解析

实战案例 2：绘制项目贡献比例饼图

场景描述

实现思路

代码实现

深度解析

实战案例 3：绘制趋势折线图

场景描述

实现思路

代码实现

深度解析

进阶：处理复杂数据与 CSV 格式

常见错误与解决方案

总结

相关文章美国1G带宽/1T流量高速vps $17.99/年