R语言 iris 数据集拆分:按比例随机分配

本文将介绍如何使用 R 语言中的 sample 函数将 iris 数据集按 1:2 的比例随机拆分为两个数据集,并提供示例代码和详细解释。

代码示例:

# 加载 iris 数据集
data(iris)

# 设置随机数种子,保证结果可重复
set.seed(123)

# 按 1:2 的比例随机分配数据集
index <- sample(1:nrow(iris), size = nrow(iris) * 0.5, replace = FALSE)
iris1 <- iris[index, ]
iris2 <- iris[-index, ]

代码解释:

  1. 加载 iris 数据集: 使用 data(iris) 加载 R 语言内置的 iris 数据集。
  2. 设置随机数种子: 使用 set.seed(123) 设置随机数种子,确保每次运行代码得到的结果一致。
  3. 随机抽取样本: 使用 sample(1:nrow(iris), size = nrow(iris) * 0.5, replace = FALSE) 从 1 到数据集行数 nrow(iris) 中随机抽取一半的行数,作为 iris1 数据集的行索引。replace = FALSE 表示不允许重复抽样。
  4. 拆分数据集: 使用 [] 运算符根据索引 indexiris 数据集拆分成 iris1iris2 两个数据集。

通过以上步骤,您可以将 iris 数据集按 1:2 的比例随机拆分为两个数据集,并用于后续的机器学习或数据分析任务。

R语言 iris 数据集拆分:按比例随机分配

原文地址: https://www.cveoy.top/t/topic/n2yF 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录