pandas 某列去重
要在pandas中对某列进行去重,可以使用drop_duplicates()方法。这个方法会返回一个新的DataFrame,其中包含指定列的唯一值。
以下是一个示例代码:
import pandas as pd
# 创建一个包含重复值的DataFrame
data = {'col1': [1, 2, 2, 3, 4, 4, 5]}
df = pd.DataFrame(data)
# 对col1列进行去重
df_unique = df['col1'].drop_duplicates()
print(df_unique)
输出结果为:
0 1
1 2
3 3
4 4
6 5
Name: col1, dtype: int64
在这个示例中,我们创建了一个包含重复值的DataFrame,并使用drop_duplicates()方法对col1列进行去重。最后,打印出去重后的结果。
注意:drop_duplicates()方法默认会保留第一个出现的唯一值,如果想要保留最后一个出现的唯一值,可以使用keep='last'参数。
原文地址: https://www.cveoy.top/t/topic/iYKv 著作权归作者所有。请勿转载和采集!