使用Pandas的merge函数根据一列数据筛选DataFrame

在数据处理过程中,经常需要根据一个DataFrame中的某一列数据,提取另一个DataFrame中对应的数据。Pandas的merge函数为此提供了一种高效便捷的方法。

以下是一个示例,展示如何使用merge函数实现这一目标:

import pandas as pd

# 创建第一个DataFrame
df1 = pd.DataFrame({'ID': [1, 2, 3, 4],
                   'Name': ['Alice', 'Bob', 'Charlie', 'David']})

# 创建第二个DataFrame
df2 = pd.DataFrame({'ID': [2, 4],
                   'Age': [25, 30]})

# 使用merge函数根据df1中的'ID'列提取df2中的内容
result = pd.merge(df1, df2, on='ID')

print(result)

输出结果为:

   ID   Name  Age
0   2    Bob   25
1   4  David   30

在这个例子中:

  1. 我们首先创建了两个DataFrame:df1df2
  2. df1包含'ID'和'Name'两列,而df2包含'ID'和'Age'两列。
  3. 我们使用merge函数将df1df2根据共同的'ID'列进行合并。
  4. merge函数的on参数指定了用于合并的列名。
  5. 合并后的结果存储在result变量中,并打印输出。

可以看到,result DataFrame只包含df1中'ID'列的值也出现在df2中的行。

通过这种方式,我们可以方便地使用Pandas的merge函数根据一个DataFrame中的一列数据提取另一个DataFrame中的内容。

Pandas技巧:如何使用一列数据筛选DataFrame

原文地址: https://www.cveoy.top/t/topic/ewVb 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录