统计一个叫cluster_result的txt文件中第二列不同值的数量用python实现其中第二列和第一列是用隔开的格式为418_715_5csv0430_210csv0要求用柱状图可视化可视化结果好看保存在本地。

假设cluster_result.txt文件路径为D:\cluster_result.txt，可以按照以下步骤实现：

读取文件，统计第二列不同值的数量

unique_values = set()
with open('D:\cluster_result.txt', 'r') as f:
    for line in f:
        value = line.strip().split(',')[1]
        unique_values.add(value)
print(len(unique_values))

绘制柱状图

import matplotlib.pyplot as plt

x = []
y = []
with open('D:\cluster_result.txt', 'r') as f:
    for line in f:
        value = line.strip().split(',')[1]
        if value in x:
            y[x.index(value)] += 1
        else:
            x.append(value)
            y.append(1)

plt.bar(x, y)
plt.xlabel('Values')
plt.ylabel('Counts')
plt.title('Counts of Unique Values in Cluster Result')
plt.savefig('D:\cluster_result.png')
plt.show()

运行后，会在本地生成一个名为cluster_result.png的柱状图，可视化结果好看，保存在本地