划分数据集为训练集和测试机python

可以使用sklearn库中的train_test_split函数来划分数据集。

示例代码：

from sklearn.model_selection import train_test_split

# 假设X为特征向量，y为标签
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# test_size表示测试集占总数据集的比例，random_state用于随机数生成器的种子，保证每次运行结果相同

上述代码将数据集划分为训练集和测试集，其中训练集占总数据集的70%，测试集占30%。划分后得到4个变量：X_train、X_test、y_train、y_test，分别表示训练集的特征向量、测试集的特征向量、训练集的标签、测试集的标签。可以使用这些变量来训练模型和评估模型的准确性。