Pandas 数据处理:筛选、去重计数并添加新列
假设原始数据为 df,包含两列 'A' 和 'B':
import pandas as pd
df = pd.DataFrame({'A': ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'],
'B': [1, 2, 3, 4, 5, 6, 7, 8]})
1. 筛选数据:
按 'B' 列大于 5 取数,可以使用以下代码:
df = df[df['B'] > 5]
2. 计算去重数量:
计算 'A' 列去重后的总数量,可以使用以下代码:
num = len(df['A'].unique())
3. 添加新列:
将 num 合并进全表格新列 'num',可以使用以下代码:
df['num'] = num
完整代码:
import pandas as pd
df = pd.DataFrame({'A': ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'],
'B': [1, 2, 3, 4, 5, 6, 7, 8]})
df = df[df['B'] > 5]
num = len(df['A'].unique())
df['num'] = num
print(df)
输出结果:
A B num
5 f 6 3
6 g 7 3
7 h 8 3
原文地址: https://www.cveoy.top/t/topic/odBs 著作权归作者所有。请勿转载和采集!