帮我写一个基于pandas numpy 库和python语言进行数据处理 最后并用Matplotlib库来进行可视化。首先要读取在D大學大二下學期數據可視化期末作業數據整理被引次數xlsx里的excel檔并对档案中的被引频次进行降序抽出前十的数据对X轴设置间距 可视化图上要显示中文字符 全部的中文字符即论文名称一列的数据都要显示出来 不让中文字符有重迭 可以改变下图表的大小以上数据用柱状图进行可
import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties
读取Excel文件
data = pd.read_excel('D:\大學\大二\下學期\數據可視化\期末作業\數據整理\被引次數.xlsx')
按照被引频次降序排列
data = data.sort_values(by='被引频次', ascending=False)
取前十条数据
data = data.head(10)
设置中文字体
font = FontProperties(fname='C:\Windows\Fonts\simhei.ttf', size=12)
绘制柱状图
plt.figure(figsize=(10, 6)) # 设置图表大小 plt.bar(data['论文名称'], data['被引频次'], color='blue') # 绘制柱状图 plt.xticks(rotation=45, fontproperties=font) # 设置X轴标签旋转和中文字体 plt.xlabel('论文名称', fontproperties=font) # 设置X轴标签 plt.ylabel('被引频次', fontproperties=font) # 设置Y轴标签 plt.title('被引频次前十的论文', fontproperties=font) # 设置图表标题
绘制步阶图
plt.step(data['论文名称'], data['发表时间'], color='red') # 绘制步阶图 plt.xlabel('论文名称', fontproperties=font) # 设置X轴标签 plt.ylabel('发表时间', fontproperties=font) # 设置Y轴标签 plt.title('被引频次前十的论文发表时间', fontproperties=font) # 设置图表标题
显示图表
plt.show(
原文地址: https://www.cveoy.top/t/topic/hxyU 著作权归作者所有。请勿转载和采集!