使用Python统计TXT文件第二列不同值数量并可视化

本文将介绍如何使用Python代码统计一个TXT文件中第二列不同值的数量,并用柱状图进行可视化。

假设TXT文件名为'data.txt',内容如下:

1,a
2,b
3,c
4,a
5,d
6,b
7,e
8,f
9,c

代码如下:

import matplotlib.pyplot as plt

# 读取txt文件
with open('data.txt', 'r') as f:
    lines = f.readlines()

# 统计第二列不同值的数量
count = {}
for line in lines:
    items = line.strip().split(',')
    # 处理可能出现空行或数据格式错误的情况
    if len(items) >= 2:
        key = items[1]
        if key in count:
            count[key] += 1
        else:
            count[key] = 1

# 可视化
plt.bar(range(len(count)), count.values())
plt.xticks(range(len(count)), count.keys())
plt.xlabel('Second Column')
plt.ylabel('Count')
plt.title('Second Column Count')
plt.savefig('result.png')
plt.show()

运行结果如下:

result.png

代码说明:

  1. **读取文件:**使用 with open('data.txt', 'r') as f: 语句打开文件,并读取所有行到 lines 列表中。
  2. **统计不同值数量:**使用 for 循环遍历每一行,用 split(',') 分割字符串,并将第二列的值作为 key,统计其出现的次数。
  3. **可视化:**使用 matplotlib.pyplot 库绘制柱状图,并将结果保存为 result.png 文件。

避免'list index out of range'错误:

代码中添加了 if len(items) >= 2: 的判断语句,用于处理可能出现的空行或数据格式错误的情况,防止 items[1] 超出索引范围。

总结:

本文介绍了使用Python代码统计TXT文件中第二列不同值的数量,并用柱状图进行可视化。代码包含处理文件读取、数据统计和可视化等步骤,并提供解决方案避免出现'list index out of range'错误。

Python统计TXT文件第二列不同值数量并可视化

原文地址: https://www.cveoy.top/t/topic/jKuN 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录