以下是一个例子:

def split_dataset(dataset, split_ratio):
    train_size = int(len(dataset) * split_ratio)
    train_set = []
    test_set = list(dataset)
    while len(train_set) < train_size:
        index = random.randrange(len(test_set))
        train_set.append(test_set.pop(index))
    return train_set, test_set

该函数接受两个参数:数据集和划分比例。它将根据划分比例将数据集分为训练集和测试集,返回这两个数据集。

在函数内部,我们首先计算训练集大小,然后创建一个空的训练集列表和测试集列表。我们使用 list() 函数将数据集复制到测试集列表中,以便我们可以在其中删除元素,而不影响原始数据集。

然后,我们使用 while 循环将随机选择的元素添加到训练集中,直到训练集大小达到预定大小。我们使用 random.randrange() 函数从测试集中选择一个元素,并使用 pop() 函数将其从测试集中删除,并将其添加到训练集中。

最后,我们将训练集和测试集返回给调用函数的代码

python定义以一个划分数据集的函数

原文地址: https://www.cveoy.top/t/topic/eZdn 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录