划分数据集为训练集和测试机python
可以使用sklearn库中的train_test_split函数来划分数据集。
示例代码:
from sklearn.model_selection import train_test_split
# 假设X为特征向量,y为标签
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# test_size表示测试集占总数据集的比例,random_state用于随机数生成器的种子,保证每次运行结果相同
上述代码将数据集划分为训练集和测试集,其中训练集占总数据集的70%,测试集占30%。划分后得到4个变量:X_train、X_test、y_train、y_test,分别表示训练集的特征向量、测试集的特征向量、训练集的标签、测试集的标签。可以使用这些变量来训练模型和评估模型的准确性。
原文地址: https://www.cveoy.top/t/topic/dHVA 著作权归作者所有。请勿转载和采集!