Python 数据分析实战:鸢尾花数据可视化分析
Python 数据分析实战:鸢尾花数据可视化分析
本教程将带你使用 Python 的 pandas 和 matplotlib 模块对鸢尾花数据进行分析和可视化。通过分析萼片和花瓣数据,了解鸢尾花的生长规律,并绘制柱状图和折线图展示分析结果。
任务描述
花农需要通过花的特征数据了解花的生长状况,数据分析师通过分析花的萼片与花瓣数据,可以分析出花的生长规律趋势。本教程将使用 Python 进行数据分析,具体步骤如下:
- 创建工程:
- 创建名为
data_analysis的工程文件夹。 - 将包含鸢尾花数据的 CSV 文件
flowers.csv放入工程文件夹,路径为./flowers.csv。
- 创建名为
- 创建 Python 文件:
- 在工程文件夹中创建 Python 文件,例如
analysis.py。 - 导入
pandas和matplotlib.pyplot模块:import pandas as pd import matplotlib.pyplot as plt
- 在工程文件夹中创建 Python 文件,例如
- 读取数据文件:
- 使用
pandas的read_csv()函数读取flowers.csv文件。 - 将萼片和花瓣数据存入数组,并计算花瓣面积。
- 使用
- 数据清洗:
- 删除数据中存在的
NaN值(空值)。
- 删除数据中存在的
- 设置坐标轴:
- 将萼片数据作为 x 轴数据,花瓣数据作为 y 轴数据。
- 绘制柱状图:
- 使用
matplotlib.pyplot的bar()函数绘制柱状图,并设置标题、坐标轴标签等。
- 使用
- 绘制折线图:
- 使用
matplotlib.pyplot的plot()函数绘制折线图,并设置标题、坐标轴标签、线型、颜色等样式。
- 使用
实施条件
| 序号 | 设备、软件名称 | 规格/技术参数、用途 | 备注 | |---|---|---|---| | 1 | 大数据技术实训机房 | 测试场地 | 保证参考人员有足够间距 | | 2 | 计算机 | CPU 奔腾 4 以上,内存 2G 以上。XP 或 Win7 操作系统、 linux 操作系统(ubuntu 或 centos) | 用于软件开发和软件部署, 每人一台。 | | 3 | Pycharm2018.2 或 IntelliJ IDEA2018.2 | 开发工具 | 参考人员选用一种开发工具 | | 4 | Chrome55 或以上 | 浏览器 | |
考核时量
考核时间为 120 分钟。
评分细则
| 要求类别 | 评价项 | 分值 | 评分细则 | |---|---|---|---| | 技能要求 | 创建工程 | 5分 | 工程名称错误,扣 2 分;导入 csv 文件错误,扣 3 分。 | | | 创建文件及模块导入 | 5分 | 文件名错误,扣 1 分;导入 csv 模块错误,扣 2 分;导入 matplotlib.pyplot 模块错误,扣 2 分。 | | | 读取数据文件 | 15分 | 读取文件错误,扣 5 分;数据存入数组错误,扣 5 分;面积计算错误,扣 5 分。 | | | 删除数据 | 10分 | 未进行数据清洗空值判断,扣 5 分;未处理空值数据删除,扣 5 分。 | | | 设置坐标轴 | 15分 | x 轴数据设置错误,扣 5 分;y 轴数据设置错误,扣 5 分;花瓣格式转换错误,扣 5 分。 | | | 鸢尾花数据柱状图 | 20 | 柱状图绘制显示错误,扣 4 分;若呈现的图中无标题,扣 2 分;柱状不显示,扣 4 分;无坐标名字显示等内容的设置,扣 2 分;显示内容不包含每个花瓣的数据,扣 4 分;数据显示错误,扣 4 分;无需跟参考答案一致,保存图片。 | | | 鸢尾花数据折线图 | 20 | 折线图绘制显示错误,扣 4 分;若呈现的图中无标题,扣 2 分;折线不显示,扣 4 分;无坐标名字显示等内容的设置,扣 2 分;显示内容不包含每个花瓣的数据,扣 4 分;数据显示错误,扣 4 分;无需跟参考答案一致,保存图片。 | | 素养要求 | 项目文档 | 5分 | 按题目的考核要求提交考核结果的文档,文件命名和排版规范。 | | | 职业素养 | 5分 | 注重实训场所的安全管理规定,遵守操作规程和考场纪律。 |
注意:
- 请根据提供的
flowers.csv文件进行数据分析。 - 绘制的图表无需与参考答案一致,但应包含必要的信息和设置。
- 完成后,请将代码和图表保存并提交。
祝你学习愉快!
原文地址: https://www.cveoy.top/t/topic/fw1U 著作权归作者所有。请勿转载和采集!