Pandas nlargest 函数详解:查找 DataFrame 中的最大值

在数据分析中,经常需要从数据集中找到最大值。Pandas 提供了 nlargest() 函数,可以方便地获取 DataFrame 中指定列的最大的 n 个值。

语法

DataFrame.nlargest(n, columns, keep='first')

参数

  • n: 要返回的最大值的个数,为整数类型。
  • columns: 要查找最大值的列名,可以是单个列名或列名列表。
  • keep: 指定保留哪个最大值的索引,可选值为:
    • 'first': 保留第一个出现的最大值 (默认)。
    • 'last': 保留最后一个出现的最大值。
    • False: 不保留重复的最大值。

示例

以下示例演示了如何使用 nlargest() 函数找到 DataFrame 中 'Salary' 列最大的 3 个值:

import pandas as pd

data = {'Name': ['John', 'Emily', 'James', 'Emma', 'Michael'],
        'Age': [25, 30, 18, 22, 35],
        'Salary': [50000, 60000, 40000, 55000, 70000]}

df = pd.DataFrame(data)

# 返回 Salary 列中最大的 3 个值
top_3_salaries = df.nlargest(3, 'Salary')
print(top_3_salaries)

输出

      Name  Age  Salary
4  Michael   35   70000
1    Emily   30   60000
3     Emma   22   55000

在这个例子中,nlargest(3, 'Salary') 返回了 'Salary' 列中最大的 3 个值以及它们对应的行数据。

总结

nlargest() 函数为 Pandas 用户提供了一种简单有效的方式来查找 DataFrame 中的最大值。通过调整参数,您可以根据需求灵活地获取所需的数据。

Pandas nlargest 函数详解:查找 DataFrame 中的最大值

原文地址: http://www.cveoy.top/t/topic/dfR 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录