Python CSV 数据预处理:替换协议类型并删除列
使用 Python Pandas 处理 CSV 数据
本示例展示如何使用 Python Pandas 库,对 CSV 文件进行数据预处理,包括替换 'proto' 列的协议类型并删除 'id' 和 'label' 列。
**代码:**pythonimport pandas as pd
读取原始的CSV文件df = pd.read_csv('original.csv')
将'proto'列中的值替换为对应的数字df['proto'] = df['proto'].replace({'tcp': 0, 'udp': 1, 'arpospf': 2})
删除'id'和'label'列df = df.drop(['id', 'label'], axis=1)
保存修改后的DataFrame为新的CSV文件df.to_csv('new.csv', index=False)
步骤解析:
- 导入 Pandas 库:
import pandas as pd2. 读取 CSV 文件:df = pd.read_csv('original.csv')3. 替换 'proto' 列的值: -df['proto'] = df['proto'].replace({'tcp': 0, 'udp': 1, 'arpospf': 2})- 使用replace方法将 'proto' 列中的 'tcp'、'udp'、'arpospf' 分别替换为 0、1、2。4. 删除 'id' 和 'label' 列: -df = df.drop(['id', 'label'], axis=1)- 使用drop方法删除指定的列。5. 保存修改后的 DataFrame: -df.to_csv('new.csv', index=False)- 使用to_csv方法将修改后的 DataFrame 保存为新的 CSV 文件,并使用index=False选项避免保存索引列。
注意:
original.csv和new.csv是 CSV 文件的名称,请根据实际情况修改。- 确保你的 CSV 文件中包含 'proto'、'id' 和 'label' 列。
原文地址: https://www.cveoy.top/t/topic/i2nF 著作权归作者所有。请勿转载和采集!