鸢尾花数据集描述性分析:花萼和花瓣尺寸特征
首先,这是一份包含150个样本的数据集,每个样本都包含四个数值型变量:'Sepal.Length'(花萼长度)、'Sepal.Width'(花萼宽度)、'Petal.Length'(花瓣长度)、'Petal.Width'(花瓣宽度),以及一个分类变量:'Species'(鸢尾花的品种)。
接下来,可以对每个变量进行描述性统计分析:
-
'Sepal.Length'
- 平均值:5.84
- 中位数:5.80
- 最小值:4.30
- 最大值:7.90
- 标准差:0.83
- 四分位数:Q1=5.10,Q2=5.80,Q3=6.40
- 直方图:呈现单峰分布,大部分样本分布在5.0-6.5之间,少数样本分布在4.3-4.9和7.0-7.9之间。
-
'Sepal.Width'
- 平均值:3.05
- 中位数:3.00
- 最小值:2.00
- 最大值:4.40
- 标准差:0.43
- 四分位数:Q1=2.80,Q2=3.00,Q3=3.30
- 直方图:呈现单峰分布,大部分样本分布在2.8-3.4之间,少数样本分布在2.0-2.7和3.5-4.4之间。
-
'Petal.Length'
- 平均值:3.76
- 中位数:4.35
- 最小值:1.00
- 最大值:6.90
- 标准差:1.77
- 四分位数:Q1=1.60,Q2=4.35,Q3=5.10
- 直方图:呈现双峰分布,一个峰位于1.0-2.5之间,另一个峰位于4.5-6.9之间,中间部分较为稀疏。
-
'Petal.Width'
- 平均值:1.20
- 中位数:1.30
- 最小值:0.10
- 最大值:2.50
- 标准差:0.76
- 四分位数:Q1=0.30,Q2=1.30,Q3=1.80
- 直方图:呈现双峰分布,一个峰位于0.1-0.4之间,另一个峰位于1.4-1.8之间,中间部分较为稀疏。
-
'Species'
- 数据分为三个品种:'setosa'、'versicolor'、'virginica'
- 'setosa'的样本数为50,'versicolor'的样本数为50,'virginica'的样本数为50
- 可以通过绘制条形图或饼图来展示品种分布情况。
原文地址: https://www.cveoy.top/t/topic/lC0s 著作权归作者所有。请勿转载和采集!