Pandas df.iterrows() 函数详解：逐行迭代 DataFrame

df.iterrows() 是一个 Pandas 函数，它允许您在 DataFrame 中逐行进行迭代。它返回一个迭代器对象，每次迭代都会返回一个包含行索引和行数据的元组。

该函数常用于对 DataFrame 中的每一行进行数据处理或计算操作。例如，您可以使用 df.iterrows() 对每一行进行数据清洗、特征工程或其他特定计算。

使用方法：

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

for index, row in df.iterrows():
    print(index, row['A'], row['B'])

返回值：

df.iterrows() 返回一个迭代器对象，每次迭代都会返回一个包含两个元素的元组：

index: 行索引
row: 包含行数据的 Series 对象

示例：

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

for index, row in df.iterrows():
    print(f'行索引: {index}')
    print(f'行数据: {row}')
    print('---')

注意事项：

df.iterrows() 通常不是处理 DataFrame 的最有效方式，尤其是当 DataFrame 很大时。它会创建一个新的 Series 对象来表示每一行，这会占用额外的内存。
对于需要对 DataFrame 进行逐行操作的情况，建议使用 .apply() 方法或列表推导。

总结：

df.iterrows() 函数提供了一种方便的方式来逐行迭代 DataFrame。虽然它在处理大型 DataFrame 时效率可能不是最高，但对于小型 DataFrame 或需要对每一行进行自定义操作的情况，它是一个非常实用的工具。

Pandas df.iterrows() 函数详解：逐行迭代 DataFrame