python定义一个划分数据集的函数
以下是一个Python函数,用于将数据集划分为训练集和测试集:
import random
def split_dataset(dataset, split_ratio):
train_size = int(len(dataset) * split_ratio)
train_set = []
test_set = list(dataset)
while len(train_set) < train_size:
index = random.randrange(len(test_set))
train_set.append(test_set.pop(index))
return train_set, test_set
该函数接受两个参数:dataset是要划分的数据集,split_ratio是训练集所占比例。例如,如果split_ratio为0.7,则训练集将占数据集的70%,测试集将占30%。
函数首先计算出训练集的大小,然后在循环中随机选择数据集中的元素,添加到训练集中,并从测试集中删除该元素。最后,函数返回训练集和测试集的列表
原文地址: https://www.cveoy.top/t/topic/eZdH 著作权归作者所有。请勿转载和采集!