假设原始数据为 df,包含两列 'A' 和 'B':

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'],
                   'B': [1, 2, 3, 4, 5, 6, 7, 8]})

1. 筛选数据:

按 'B' 列大于 5 取数,可以使用以下代码:

df = df[df['B'] > 5]

2. 计算去重数量:

计算 'A' 列去重后的总数量,可以使用以下代码:

num = len(df['A'].unique())

3. 添加新列:

将 num 合并进全表格新列 'num',可以使用以下代码:

df['num'] = num

完整代码:

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'],
                   'B': [1, 2, 3, 4, 5, 6, 7, 8]})

df = df[df['B'] > 5]

num = len(df['A'].unique())

df['num'] = num

print(df)

输出结果:

   A  B  num
5  f  6    3
6  g  7    3
7  h  8    3
Pandas 数据处理:筛选、去重计数并添加新列

原文地址: https://www.cveoy.top/t/topic/odBs 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录