Python Pandas 使用列索引号操作数据

在 Pandas 中，您可以使用 iloc 方法根据列的索引号（从 0 开始）来选择和操作数据，而无需使用实际的列名。

以下是一些示例：

1. 替换第七列中的值：

import pandas as pd

# 读取新文件
df = pd.read_csv('new_file.csv')

# 替换第七列中的1为'idoc 6'
df.iloc[:, 6] = df.iloc[:, 6].replace(1, 'idoc 6')

# 保存修改后的文件
df.to_csv('modified_file.csv', index=False)

2. 根据第七列的值提取行数据：

# 提取包含特定日期的行数据为新文件1
df1 = df[df.iloc[:, 6].isin(['2021/4/3', '2021/4/4', '2021/4/5', '2021/4/10', '2021/4/11'])]
df1.to_csv('new_file1.csv', index=False)

# 提取剩余行数据为新文件2
df2 = df[~df.iloc[:, 6].isin(['2021/4/3', '2021/4/4', '2021/4/5', '2021/4/10', '2021/4/11'])]
df2.to_csv('new_file2.csv', index=False)

在这些示例中：

df.iloc[:, 6] 表示选择第七列的所有行数据。
replace() 方法用于替换指定列中的值。
isin() 方法用于检查指定列中的值是否在给定的列表中。
~ 符号用于对条件进行取反，选择不满足条件的行。

请将代码中的 'new_file.csv' 替换为您实际的新文件路径。

希望这些示例能够帮助您理解如何使用列索引号操作 Pandas DataFrame 中的数据！