任务描述

餐厅消费数据是反映大众消费水平的重要信息。数据分析师通过分析餐厅消费数据,可以分析大众的消费水平。具体需要用到 Python 编程语言的 pandas 模块读取数据文件,用到 Python 基础语法清理计算消费数据,用到 matplotlib 模块进行结果的柱状图和折线图绘制。请根据提供的数据文件完成以下操作:

  1. 建工程 data_analysis,将数据文件放入工程,路径为 ./tip.csv。
  2. 创建 python 文件,导入 pandas, matplotlib.pyplot 模块。
  3. 读取数据文件,将消费数据存到 dataframe。
  4. 删除票房字段数据的 NaN 值,也就是数据清洗的空值删除。
  5. 将总消费或消费人数名作为 x 轴数据,将小费作为 y 轴数据。
  6. 根据提供的数据绘制柱形图。
  7. 根据提供的数据绘制折线图,并设置折线图的各种样式。

实施条件

测试所需的软硬件设备见表 4-11-1。

| 序号 | 设备、软件名称 | 规格/技术参数、用途 | 备注 | |---|---|---|---| | 1 | 大数据技术实训 机房 | 测试场地 | 保证参考人员有足够间距 | | 2 | 计算机 | CPU 奔腾 4 以上,内存 2G 以上。 XP 或 Win7 操作系统、 linux 操 作系统(ubuntu 或 centos) | 用于软件开发和软件部署, 每人 一台。 | | 3 | Pycharm2018.2 或 IntelliJ IDEA2018.2 | 开发工具 | 参考人员选用一种开发工具 | | 4 | Chrome55 或以 上 | 浏览器 | |

考核时量

考核时间为 120 分钟。

评分细则

评分细则见表 4-11-2。

| 要求类别 | 评价项 | 分值 | 评分细则 | |---|---|---|---| | 技能要求 | 创建工程 | 5分 | 工程名称错误,扣 2 分; 导入 csv 文件错误,扣 3 分。 | | | 创建文件及模块导入 | 5分 | 文件名错误,扣 1 分; 导入 csv 模块错误,扣 2 分; 导入 matplotlib.pyplot 模块错误,扣 2 分。 | | | 读取数据文件 | 15分 | 读取文件错误,扣 10 分; 数据存入 dataframe 错误,扣 5 分。 | | | 删除数据 | 10分 | 未进行数据清洗空值判断,扣 5 分; 未处理空值数据删除,扣 5 分。 | | | 设置坐标轴 | 15分 | x 轴数据设置错误,扣 5 分; y 轴数据设置错误,扣 5 分; 总消费或消费人数格式转换错误,扣 5 分。 | | | 消费数据柱状图 | 20分 | 柱状图绘制显示错误,扣 4 分; 若呈现的图中无标题,扣 2 分; 柱状不显示,扣 4 分; 无坐标名字显示等内容的设置,扣 2 分; 显示内容不包含消费数据,扣 4 分; 数据显示错误,扣 4 分; 无需跟参考答案一致,保存图片。 | | | 消费数据折线图 | 20分 | 折线图绘制显示错误,扣 4 分; 若呈现的图中无标题,扣 2 分; 折线不显示,扣 4 分; 无坐标名字显示等内容的设置,扣 2 分; 显示内容不包含消费数据,扣 4 分; 数据显示错误,扣 4 分; 无需跟参考答案一致,保存图片。 | | 素养要求 | 项目文档 | 5分 | 按题目的考核要求提交考核结果的文档,文件命名和排版规范。 | | | 职业素养 | 5分 | 注重实训场所的安全管理规定,遵守操作规程和考场纪律。 |

Python 数据分析实战:餐厅消费数据可视化

原文地址: https://www.cveoy.top/t/topic/fw11 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录