Python 數據處理與可視化:利用 NumPy 和 Matplotlib 找出高頻詞並繪製圖表
import numpy as np import matplotlib.pyplot as plt
data = {'馆际互借': 14, '文献传递服务': 14, 'CALIS': 11, '资源共享': 6, '申请量': 5, '用户需求': 4, '文献传递系统': 4, '高校图书馆': 4, '馆际互借服务': 3, '文献资源': 3, 'BALIS': 3, '高校读者': 2, '问卷调查': 2, '图书馆服务': 2, '文献服务': 2, '合理使用制度': 2, '文献需求': 2, '资源整合': 2, '出版商': 2, 'CASHL': 2}
对字典按值进行降序排列
sorted_data = sorted(data.items(), key=lambda x: x[1], reverse=True)
抽取前十个数据
top_data = sorted_data[:10]
将数据转换为numpy数组
labels, values = zip(*top_data) labels = np.array(labels) values = np.array(values)
对中文字符进行处理,设置间距
plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False plt.figure(figsize=(10, 6)) plt.subplots_adjust(bottom=0.3) plt.xticks(rotation=45, ha='right') plt.tick_params(axis='x', labelsize=8)
绘制条形图
plt.bar(labels, values)
添加标题和标签
plt.title('高频词出现次数') plt.xlabel('高频词') plt.ylabel('出现次数')
plt.show()
原文地址: https://www.cveoy.top/t/topic/oZ1R 著作权归作者所有。请勿转载和采集!