以下是一个读取 Excel 文件并进行数据分析的 Python 程序:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 读取 Excel 文件
data = pd.read_excel('data.xlsx')

# 预处理数据
data = data.dropna() # 删除缺失值
data['total'] = data['math'] + data['english'] + data['physics'] # 计算总分
data['average'] = data['total'] / 3 # 计算平均分

# 统计分析
print('总人数:', len(data))
print('平均分:', data['average'].mean())
print('最高分:', data['total'].max())
print('最低分:', data['total'].min())

# 绘制成绩分布图
plt.hist(data['total'], bins=20)
plt.xlabel('Total Score')
plt.ylabel('Number of Students')
plt.title('Score Distribution')
plt.show()

该程序首先使用pandas库读取名为data.xlsx的 Excel 文件,并对数据进行预处理,计算出每个学生的总分和平均分。然后,使用numpy库和matplotlib库进行数据统计分析和绘图,分别输出总人数、平均分、最高分、最低分,并绘制成绩分布图。

Python Excel 数据分析:读取、预处理和可视化

原文地址: https://www.cveoy.top/t/topic/oWpc 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录