df.iterrows() 是一个 Pandas 函数,它允许您在 DataFrame 中逐行进行迭代。它返回一个迭代器对象,每次迭代都会返回一个包含行索引和行数据的元组。

该函数常用于对 DataFrame 中的每一行进行数据处理或计算操作。例如,您可以使用 df.iterrows() 对每一行进行数据清洗、特征工程或其他特定计算。

使用方法:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

for index, row in df.iterrows():
    print(index, row['A'], row['B'])

返回值:

df.iterrows() 返回一个迭代器对象,每次迭代都会返回一个包含两个元素的元组:

  • index: 行索引
  • row: 包含行数据的 Series 对象

示例:

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

for index, row in df.iterrows():
    print(f'行索引: {index}')
    print(f'行数据: {row}')
    print('---')

注意事项:

  • df.iterrows() 通常不是处理 DataFrame 的最有效方式,尤其是当 DataFrame 很大时。它会创建一个新的 Series 对象来表示每一行,这会占用额外的内存。
  • 对于需要对 DataFrame 进行逐行操作的情况,建议使用 .apply() 方法或列表推导。

总结:

df.iterrows() 函数提供了一种方便的方式来逐行迭代 DataFrame。虽然它在处理大型 DataFrame 时效率可能不是最高,但对于小型 DataFrame 或需要对每一行进行自定义操作的情况,它是一个非常实用的工具。

Pandas df.iterrows() 函数详解:逐行迭代 DataFrame

原文地址: https://www.cveoy.top/t/topic/oTJt 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录