Python Pandas 使用列索引号操作数据

在 Pandas 中,您可以使用 iloc 方法根据列的索引号(从 0 开始)来选择和操作数据,而无需使用实际的列名。

以下是一些示例:

1. 替换第七列中的值:

import pandas as pd

# 读取新文件
df = pd.read_csv('new_file.csv')

# 替换第七列中的1为'idoc 6'
df.iloc[:, 6] = df.iloc[:, 6].replace(1, 'idoc 6')

# 保存修改后的文件
df.to_csv('modified_file.csv', index=False)

2. 根据第七列的值提取行数据:

# 提取包含特定日期的行数据为新文件1
df1 = df[df.iloc[:, 6].isin(['2021/4/3', '2021/4/4', '2021/4/5', '2021/4/10', '2021/4/11'])]
df1.to_csv('new_file1.csv', index=False)

# 提取剩余行数据为新文件2
df2 = df[~df.iloc[:, 6].isin(['2021/4/3', '2021/4/4', '2021/4/5', '2021/4/10', '2021/4/11'])]
df2.to_csv('new_file2.csv', index=False)

在这些示例中:

  • df.iloc[:, 6] 表示选择第七列的所有行数据。
  • replace() 方法用于替换指定列中的值。
  • isin() 方法用于检查指定列中的值是否在给定的列表中。
  • ~ 符号用于对条件进行取反,选择不满足条件的行。

请将代码中的 'new_file.csv' 替换为您实际的新文件路径。

希望这些示例能够帮助您理解如何使用列索引号操作 Pandas DataFrame 中的数据!

Python Pandas 使用列索引号操作数据

原文地址: https://www.cveoy.top/t/topic/F9u 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录