CSV 数据预处理:编码分类特征并删除指定列
import pandas as pd
读取原始csv文件
data = pd.read_csv('data.csv')
将字符串替换为编码值
data['proto'] = data['proto'].replace(data['proto'].unique(), range(len(data['proto'].unique()))) data['service'] = data['service'].replace(data['service'].unique(), range(len(data['service'].unique()))) data['state'] = data['state'].replace(data['state'].unique(), range(len(data['state'].unique()))) data['attack_cat'] = data['attack_cat'].replace(data['attack_cat'].unique(), range(len(data['attack_cat'].unique())))
删除'id'和'label'列
data = data.drop(['id', 'label'], axis=1)
保存到新的csv文件
data.to_csv('new_data.csv', index=False)
原文地址: http://www.cveoy.top/t/topic/i1QW 著作权归作者所有。请勿转载和采集!