统计一个叫cluster_result的txt文件中第二列不同值的数量用python实现其中第二列和第一列是用隔开的格式为418_715_5csv0430_210csv0要求用柱状图可视化可视化结果好看保存在本地。
假设cluster_result.txt文件路径为D:\cluster_result.txt,可以按照以下步骤实现:
- 读取文件,统计第二列不同值的数量
 
unique_values = set()
with open('D:\cluster_result.txt', 'r') as f:
    for line in f:
        value = line.strip().split(',')[1]
        unique_values.add(value)
print(len(unique_values))
- 绘制柱状图
 
import matplotlib.pyplot as plt
x = []
y = []
with open('D:\cluster_result.txt', 'r') as f:
    for line in f:
        value = line.strip().split(',')[1]
        if value in x:
            y[x.index(value)] += 1
        else:
            x.append(value)
            y.append(1)
plt.bar(x, y)
plt.xlabel('Values')
plt.ylabel('Counts')
plt.title('Counts of Unique Values in Cluster Result')
plt.savefig('D:\cluster_result.png')
plt.show()
- 运行后,会在本地生成一个名为cluster_result.png的柱状图,可视化结果好看,保存在本地
 
原文地址: https://www.cveoy.top/t/topic/celD 著作权归作者所有。请勿转载和采集!