R语言 iris 数据集拆分：按比例随机分配

本文将介绍如何使用 R 语言中的 sample 函数将 iris 数据集按 1:2 的比例随机拆分为两个数据集，并提供示例代码和详细解释。

代码示例:

# 加载 iris 数据集
data(iris)

# 设置随机数种子，保证结果可重复
set.seed(123)

# 按 1:2 的比例随机分配数据集
index <- sample(1:nrow(iris), size = nrow(iris) * 0.5, replace = FALSE)
iris1 <- iris[index, ]
iris2 <- iris[-index, ]

代码解释:

加载 iris 数据集: 使用 data(iris) 加载 R 语言内置的 iris 数据集。
设置随机数种子: 使用 set.seed(123) 设置随机数种子，确保每次运行代码得到的结果一致。
随机抽取样本: 使用 sample(1:nrow(iris), size = nrow(iris) * 0.5, replace = FALSE) 从 1 到数据集行数 nrow(iris) 中随机抽取一半的行数，作为 iris1 数据集的行索引。replace = FALSE 表示不允许重复抽样。
拆分数据集: 使用 [] 运算符根据索引 index 将 iris 数据集拆分成 iris1 和 iris2 两个数据集。

通过以上步骤，您可以将 iris 数据集按 1:2 的比例随机拆分为两个数据集，并用于后续的机器学习或数据分析任务。