Python 数据分析与可视化:学生成绩分析实战
Python 数据分析与可视化:学生成绩分析实战
考试是每一位学生和教师不可回避的问题。分析考试成绩是教师必做的工作之一。但是,如何做好这项工作,却有很多值得研究的地方。全面推进班级学生成绩这项工作尤为重要。现在计算机与网络特别发达,获取学生的成绩非常简单。学生成绩越多,参考的价值越大。我们可以通过计算机进行数据分析、统计结果的方式,去了解学生的成绩,从而分析在教学过程中的可借鉴点与不足。
学生成绩分析数据包含每位同学成绩的数据,要分析每个班的平均成绩需要将每个班的同学成绩求和,再求平均值,具体需要用到Python编程语言的csv模块读取数据文件,用到Python基础语法计算平均成绩,用到matplotlib模块进行结果的柱状图和折线图绘制,请根据提供的数据文件完成以下操作:
-
创建工程
- 创建工程
data_analysis,将数据文件score.csv放入工程,路径为./score.csv。
- 创建工程
-
创建 Python 文件
- 创建 Python 文件,导入
csv及matplotlib.pyplot模块。
- 创建 Python 文件,导入
-
读取数据文件
- 定义文件流,读取数据文件,定义列表将文件数据加进列表,打印列表数据。
-
定义列表头
- 定义列表用作表头
['大数据32101', '大数据32102', '大数据32103']。
- 定义列表用作表头
-
定义变量
- 定义 6 个变量用于存储每个班的总分与人数。
-
计算平均分
- 通过列表数据计算每个班的平均分。
-
绘制柱形图
- 绘制柱形图,添加横坐标班级,纵坐标平均成绩。
-
显示柱形图
- 将数据插进柱形图并显示。
实施条件
测试所需的软硬件设备见表 4-1-1。
| 序号 | 设备、软件名称 | 规格/技术参数、用途 | 备注 | |---|---|---|---| | 1 | 大数据技术实训机房 | 测试场地 | 保证参考人员有足够间距 | | 2 | 计算机 | CPU 奔腾 4 以上,内存 2G 以上。XP 或 Win7 操作系统、 linux 操作系统(ubuntu 或 centos) | 用于软件开发和软件部署,每人一台。 | | 3 | Pycharm2018.2 或 IntelliJ IDEA2018.2 | 开发工具 | 参考人员选用一种开发工具 | | 4 | Chrome55 或以上 | 浏览器 |
考核时量
考核时间为120分钟。
评分细则
| 要求类别 | 评价项 | 分值 | 评分细则 | |---|---|---|---| | 技能要求 | 创建工程 | 5分 | 工程名称错误,扣2分;导入 csv 文件错误,扣3分。 | | | 创建文件及模块导入 | 5分 | 文件名错误,扣1分;导入 csv 模块错误,扣2分;导入 matplotlib.pyplot 模块错误,扣2分。 | | | 读取文件数据 | 20分 | 定义文件流错误,扣5分;使用循环读取数据文件错误,扣10分;打印列表数据错误,扣5分。 | | | 定义列表头 | 5分 | 定义列表头错误,扣5分 | | | 定义变量 | 5分 | 定义变量错误,扣5分 | | | 平均分计算 | 20分 | 正确读取列表文件,计算三个班平均分,每个班5分;将平均分存入列表错误,扣5分 | | | 绘制柱形图 | 20分 | 设置柱形图(横、纵)标题错误,扣5分;设置可支持中文失败,扣5分;设置总标题错误,扣5分;绘制数据错误,扣5分。 | | | 柱状图显示 | 10分 | 保存图片,数据全部显示错误,扣10分。 | | 素养要求 | 项目文档 | 5分 | 按题目的考核要求提交考核结果的文档,文件命名和排版规范。 | | | 职业素养 | 5分 | 注重实训场所的安全管理规定,遵守操作规程和考场纪律。 |
任务完成情况
① 创建工程 data_analysis,将数据文件放入工程,路径为 ./score.csv。
② 创建 Python 文件,导入 csv 及 matplotlib.pyplot 模块。
③ 定义文件流,读取数据文件,定义列表将文件数据加进列表,打印列表数据。
④ 定义列表用作表头 ['大数据32101', '大数据32102', '大数据32103']。
⑤ 定义 6 个变量用于存储每个班的总分与人数。
⑥ 通过列表数据计算每个班的平均分。
⑦ 绘制柱形图,添加横坐标班级,纵坐标平均成绩。
⑧ 将数据插进柱形图并显示。
原文地址: https://www.cveoy.top/t/topic/fw1f 著作权归作者所有。请勿转载和采集!