R语言 iris 数据集拆分:按比例随机分配
R语言 iris 数据集拆分:按比例随机分配
本文将介绍如何使用 R 语言中的 sample 函数将 iris 数据集按 1:2 的比例随机拆分为两个数据集,并提供示例代码和详细解释。
代码示例:
# 加载 iris 数据集
data(iris)
# 设置随机数种子,保证结果可重复
set.seed(123)
# 按 1:2 的比例随机分配数据集
index <- sample(1:nrow(iris), size = nrow(iris) * 0.5, replace = FALSE)
iris1 <- iris[index, ]
iris2 <- iris[-index, ]
代码解释:
- 加载 iris 数据集: 使用
data(iris)加载 R 语言内置的iris数据集。 - 设置随机数种子: 使用
set.seed(123)设置随机数种子,确保每次运行代码得到的结果一致。 - 随机抽取样本: 使用
sample(1:nrow(iris), size = nrow(iris) * 0.5, replace = FALSE)从 1 到数据集行数nrow(iris)中随机抽取一半的行数,作为iris1数据集的行索引。replace = FALSE表示不允许重复抽样。 - 拆分数据集: 使用
[]运算符根据索引index将iris数据集拆分成iris1和iris2两个数据集。
通过以上步骤,您可以将 iris 数据集按 1:2 的比例随机拆分为两个数据集,并用于后续的机器学习或数据分析任务。
原文地址: https://www.cveoy.top/t/topic/n2yF 著作权归作者所有。请勿转载和采集!