Python train_test_split() 函数:划分特征数据集和目标变量数据集

代码 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) 使用 train_test_split 函数将特征数据集 X 和目标变量数据集 y 划分为训练集 (X_trainy_train) 和测试集 (X_testy_test)。

划分方式

  • X: 特征数据集,包含所有样本的特征信息。
  • y: 目标变量数据集,包含对应样本的目标变量信息。
  • test_size=0.2: 指定测试集的比例为 20%,即数据集中的 20% 作为测试集,80% 作为训练集。
  • random_state=42: 指定随机种子,保证每次运行代码得到的划分结果相同。

划分结果

  • X_trainy_train 为训练集的特征数据集和目标变量数据集。
  • X_testy_test 为测试集的特征数据集和目标变量数据集。

总结

train_test_split 函数是机器学习中常用的数据划分工具,可以方便地将数据集划分为训练集和测试集,以便训练模型并评估模型性能。

Python train_test_split() 函数:划分特征数据集和目标变量数据集

原文地址: https://www.cveoy.top/t/topic/DEj 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录