import pandas as pd

读取原始csv文件

data = pd.read_csv('data.csv')

将字符串替换为编码值

data['proto'] = data['proto'].replace(data['proto'].unique(), range(len(data['proto'].unique()))) data['service'] = data['service'].replace(data['service'].unique(), range(len(data['service'].unique()))) data['state'] = data['state'].replace(data['state'].unique(), range(len(data['state'].unique()))) data['attack_cat'] = data['attack_cat'].replace(data['attack_cat'].unique(), range(len(data['attack_cat'].unique())))

删除'id'和'label'列

data = data.drop(['id', 'label'], axis=1)

保存到新的csv文件

data.to_csv('new_data.csv', index=False)

CSV 数据预处理:编码分类特征并删除指定列

原文地址: http://www.cveoy.top/t/topic/i1QW 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录