python怎么划分训练集和测试集
在Python中,可以使用scikit-learn库来划分训练集和测试集。具体步骤如下:
-
首先导入sklearn库中的train_test_split模块。
-
准备好数据集和对应的标签。
-
使用train_test_split函数来划分训练集和测试集,该函数的参数包括数据集、标签、测试集比例、随机种子等。
-
将划分好的训练集和测试集分别赋给不同的变量。
示例代码如下:
from sklearn.model_selection import train_test_split
# 准备数据集和标签
data = [[1,2],[3,4],[5,6],[7,8]]
labels = [0,1,0,1]
# 划分训练集和测试集
train_data, test_data, train_labels, test_labels = train_test_split(data, labels, test_size=0.2, random_state=42)
# 输出训练集和测试集的大小
print("训练集大小:", len(train_data))
print("测试集大小:", len(test_data))
以上代码中,我们使用train_test_split函数将数据集和标签划分为训练集和测试集,测试集比例为0.2,随机种子为42。最后输出训练集和测试集的大小
原文地址: https://www.cveoy.top/t/topic/fNfd 著作权归作者所有。请勿转载和采集!