以下是一个Python函数,用于将数据集划分为训练集和测试集:

import random

def split_dataset(dataset, split_ratio):
    train_size = int(len(dataset) * split_ratio)
    train_set = []
    test_set = list(dataset)
    while len(train_set) < train_size:
        index = random.randrange(len(test_set))
        train_set.append(test_set.pop(index))
    return train_set, test_set

该函数接受两个参数:dataset是要划分的数据集,split_ratio是训练集所占比例。例如,如果split_ratio为0.7,则训练集将占数据集的70%,测试集将占30%。

函数首先计算出训练集的大小,然后在循环中随机选择数据集中的元素,添加到训练集中,并从测试集中删除该元素。最后,函数返回训练集和测试集的列表

python定义一个划分数据集的函数

原文地址: https://www.cveoy.top/t/topic/eZdH 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录