Python train_test_split() 函数:划分特征数据集和目标变量数据集
Python train_test_split() 函数:划分特征数据集和目标变量数据集
代码 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) 使用 train_test_split 函数将特征数据集 X 和目标变量数据集 y 划分为训练集 (X_train 和 y_train) 和测试集 (X_test 和 y_test)。
划分方式
X: 特征数据集,包含所有样本的特征信息。y: 目标变量数据集,包含对应样本的目标变量信息。test_size=0.2: 指定测试集的比例为 20%,即数据集中的 20% 作为测试集,80% 作为训练集。random_state=42: 指定随机种子,保证每次运行代码得到的划分结果相同。
划分结果
X_train和y_train为训练集的特征数据集和目标变量数据集。X_test和y_test为测试集的特征数据集和目标变量数据集。
总结
train_test_split 函数是机器学习中常用的数据划分工具,可以方便地将数据集划分为训练集和测试集,以便训练模型并评估模型性能。
原文地址: https://www.cveoy.top/t/topic/DEj 著作权归作者所有。请勿转载和采集!