Python统计TXT文件第二列不同值数量并可视化
使用Python统计TXT文件第二列不同值数量并可视化
本文将介绍如何使用Python代码统计一个TXT文件中第二列不同值的数量,并用柱状图进行可视化。
假设TXT文件名为'data.txt',内容如下:
1,a
2,b
3,c
4,a
5,d
6,b
7,e
8,f
9,c
代码如下:
import matplotlib.pyplot as plt
# 读取txt文件
with open('data.txt', 'r') as f:
lines = f.readlines()
# 统计第二列不同值的数量
count = {}
for line in lines:
items = line.strip().split(',')
# 处理可能出现空行或数据格式错误的情况
if len(items) >= 2:
key = items[1]
if key in count:
count[key] += 1
else:
count[key] = 1
# 可视化
plt.bar(range(len(count)), count.values())
plt.xticks(range(len(count)), count.keys())
plt.xlabel('Second Column')
plt.ylabel('Count')
plt.title('Second Column Count')
plt.savefig('result.png')
plt.show()
运行结果如下:

代码说明:
- **读取文件:**使用
with open('data.txt', 'r') as f:语句打开文件,并读取所有行到lines列表中。 - **统计不同值数量:**使用
for循环遍历每一行,用split(',')分割字符串,并将第二列的值作为key,统计其出现的次数。 - **可视化:**使用
matplotlib.pyplot库绘制柱状图,并将结果保存为result.png文件。
避免'list index out of range'错误:
代码中添加了 if len(items) >= 2: 的判断语句,用于处理可能出现的空行或数据格式错误的情况,防止 items[1] 超出索引范围。
总结:
本文介绍了使用Python代码统计TXT文件中第二列不同值的数量,并用柱状图进行可视化。代码包含处理文件读取、数据统计和可视化等步骤,并提供解决方案避免出现'list index out of range'错误。
原文地址: https://www.cveoy.top/t/topic/jKuN 著作权归作者所有。请勿转载和采集!