Pandas nlargest 函数详解:查找 DataFrame 中的最大值
Pandas nlargest 函数详解:查找 DataFrame 中的最大值
在数据分析中,经常需要从数据集中找到最大值。Pandas 提供了 nlargest() 函数,可以方便地获取 DataFrame 中指定列的最大的 n 个值。
语法
DataFrame.nlargest(n, columns, keep='first')
参数
- n: 要返回的最大值的个数,为整数类型。
- columns: 要查找最大值的列名,可以是单个列名或列名列表。
- keep: 指定保留哪个最大值的索引,可选值为:
'first': 保留第一个出现的最大值 (默认)。'last': 保留最后一个出现的最大值。False: 不保留重复的最大值。
示例
以下示例演示了如何使用 nlargest() 函数找到 DataFrame 中 'Salary' 列最大的 3 个值:
import pandas as pd
data = {'Name': ['John', 'Emily', 'James', 'Emma', 'Michael'],
'Age': [25, 30, 18, 22, 35],
'Salary': [50000, 60000, 40000, 55000, 70000]}
df = pd.DataFrame(data)
# 返回 Salary 列中最大的 3 个值
top_3_salaries = df.nlargest(3, 'Salary')
print(top_3_salaries)
输出
Name Age Salary
4 Michael 35 70000
1 Emily 30 60000
3 Emma 22 55000
在这个例子中,nlargest(3, 'Salary') 返回了 'Salary' 列中最大的 3 个值以及它们对应的行数据。
总结
nlargest() 函数为 Pandas 用户提供了一种简单有效的方式来查找 DataFrame 中的最大值。通过调整参数,您可以根据需求灵活地获取所需的数据。
原文地址: http://www.cveoy.top/t/topic/dfR 著作权归作者所有。请勿转载和采集!