Python实现数据划分：创建15个训练集用于机器学习

以下是实现数据划分的 Python 代码，将数据集分为 15 个训练集和一个测试集。

import random

# 假设 normal 样本存储在 normal_samples 列表中，spam 样本存储在 spam_samples 列表中

test_normal_samples = random.sample(normal_samples, 500)
test_spam_samples = random.sample(spam_samples, 500)

train_normal_samples = [sample for sample in normal_samples if sample not in test_normal_samples]
train_spam_samples = [sample for sample in spam_samples if sample not in test_spam_samples]

train_sets = []
for _ in range(15):
    random_train_normal_samples = random.sample(train_normal_samples, 500)
    random_train_spam_samples = random.sample(train_spam_samples, 500)
    train_set = random_train_normal_samples + random_train_spam_samples
    train_sets.append(train_set)

# train_sets 列表中包含了 15 个训练集，每个训练集都是由 500 个 normal 样本和 500 个 spam 样本组成的

请注意，以上代码中的 normal_samples 和 spam_samples 是假设已经存在的 normal 和 spam 样本列表。你需要根据实际情况进行相应的更改。