Python Pandas .loc() 函数:使用标签选择数据
.loc() 是 Pandas 库中用于索引和选择数据的一种重要方法,它允许使用标签(行和列索引)来选择数据。
.loc() 的基本语法如下:
df.loc[row_indexer, column_indexer]
其中,row_indexer 和 column_indexer 可以是单个标签、标签列表、标签切片、布尔数组或可调用函数。
例如,如果我们有一个名为 df 的 Pandas 数据框,其中包含名为 'A'、'B'、'C'、'D' 的 4 列,我们可以使用 .loc() 方法来选择特定的行和列,如下所示:
df.loc[0:5, ['A', 'B']]
这将选择第 1 到第 6 行中 'A' 和 'B' 列的数据。如果我们只想选择特定的行,可以省略列索引器:
df.loc[0:5]
这将选择第 1 到第 6 行中所有列的数据。
我们也可以使用布尔数组来选择数据:
df.loc[df['A'] > 0, ['B', 'C']]
这将选择 'A' 列中大于 0 的行,并选择 'B' 和 'C' 列的数据。
另外,我们可以使用可调用函数来选择数据,例如:
df.loc[lambda df: df['A'] > 0, ['B', 'C']]
这将使用一个 lambda 函数来选择 'A' 列中大于 0 的行,并选择 'B' 和 'C' 列的数据。
总之,.loc() 是 Pandas 中非常重要的方法,它可以方便地实现对数据的选择和索引。
原文地址: https://www.cveoy.top/t/topic/ocf5 著作权归作者所有。请勿转载和采集!