可以使用 sklearn 库中的 train_test_split 函数来实现数据集和标签的划分。该函数可以将数据集和对应的标签按照指定的比例划分为训练集和测试集。

首先,将数据集和标签分别存储为 X 和 y。假设数据集和标签的长度相等。

from sklearn.model_selection import train_test_split

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 划分验证集
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.125, random_state=42)

其中,test_size 参数用于指定测试集的比例,random_state 参数用于设置随机种子,保证每次划分的结果一致。

按照 8:1:1 的比例,可以将数据集划分为训练集、验证集和测试集,其中训练集占 80%,验证集和测试集各占 10%。

数据分割:将数据集按 8:1:1 比例划分为训练集、验证集和测试集

原文地址: https://www.cveoy.top/t/topic/phXt 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录