使用 Python Pandas 处理 CSV 数据

本示例展示如何使用 Python Pandas 库,对 CSV 文件进行数据预处理,包括替换 'proto' 列的协议类型并删除 'id' 和 'label' 列。

**代码:**pythonimport pandas as pd

读取原始的CSV文件df = pd.read_csv('original.csv')

将'proto'列中的值替换为对应的数字df['proto'] = df['proto'].replace({'tcp': 0, 'udp': 1, 'arpospf': 2})

删除'id'和'label'列df = df.drop(['id', 'label'], axis=1)

保存修改后的DataFrame为新的CSV文件df.to_csv('new.csv', index=False)

步骤解析:

  1. 导入 Pandas 库: import pandas as pd2. 读取 CSV 文件: df = pd.read_csv('original.csv')3. 替换 'proto' 列的值: - df['proto'] = df['proto'].replace({'tcp': 0, 'udp': 1, 'arpospf': 2}) - 使用 replace 方法将 'proto' 列中的 'tcp'、'udp'、'arpospf' 分别替换为 0、1、2。4. 删除 'id' 和 'label' 列: - df = df.drop(['id', 'label'], axis=1) - 使用 drop 方法删除指定的列。5. 保存修改后的 DataFrame: - df.to_csv('new.csv', index=False) - 使用 to_csv 方法将修改后的 DataFrame 保存为新的 CSV 文件,并使用 index=False 选项避免保存索引列。

注意:

  • original.csvnew.csv 是 CSV 文件的名称,请根据实际情况修改。- 确保你的 CSV 文件中包含 'proto'、'id' 和 'label' 列。
Python CSV 数据预处理:替换协议类型并删除列

原文地址: https://www.cveoy.top/t/topic/i2nF 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录