Pandas 某列去重:使用 drop_duplicates() 方法
要在 Pandas 中对某列进行去重,可以使用 'drop_duplicates()' 方法。这个方法会返回一个新的 DataFrame,其中包含指定列的唯一值。
以下是一个示例代码:
import pandas as pd
# 创建一个包含重复值的 DataFrame
data = {'col1': [1, 2, 2, 3, 4, 4, 5]}
df = pd.DataFrame(data)
# 对 col1 列进行去重
df_unique = df['col1'].drop_duplicates()
print(df_unique)
输出结果为:
0 1
1 2
3 3
4 4
6 5
Name: col1, dtype: int64
在这个示例中,我们创建了一个包含重复值的 DataFrame,并使用 'drop_duplicates()' 方法对 'col1' 列进行去重。最后,打印出去重后的结果。
注意:'drop_duplicates()' 方法默认会保留第一个出现的唯一值,如果想要保留最后一个出现的唯一值,可以使用 'keep='last'' 参数。
原文地址: https://www.cveoy.top/t/topic/dUWe 著作权归作者所有。请勿转载和采集!