Python实现数据划分:创建15个训练集用于机器学习
以下是实现数据划分的 Python 代码,将数据集分为 15 个训练集和一个测试集。
import random
# 假设 normal 样本存储在 normal_samples 列表中,spam 样本存储在 spam_samples 列表中
test_normal_samples = random.sample(normal_samples, 500)
test_spam_samples = random.sample(spam_samples, 500)
train_normal_samples = [sample for sample in normal_samples if sample not in test_normal_samples]
train_spam_samples = [sample for sample in spam_samples if sample not in test_spam_samples]
train_sets = []
for _ in range(15):
random_train_normal_samples = random.sample(train_normal_samples, 500)
random_train_spam_samples = random.sample(train_spam_samples, 500)
train_set = random_train_normal_samples + random_train_spam_samples
train_sets.append(train_set)
# train_sets 列表中包含了 15 个训练集,每个训练集都是由 500 个 normal 样本和 500 个 spam 样本组成的
请注意,以上代码中的 normal_samples 和 spam_samples 是假设已经存在的 normal 和 spam 样本列表。你需要根据实际情况进行相应的更改。
原文地址: https://www.cveoy.top/t/topic/o7f1 著作权归作者所有。请勿转载和采集!