要在 Pandas 中对某列进行去重,可以使用 'drop_duplicates()' 方法。这个方法会返回一个新的 DataFrame,其中包含指定列的唯一值。

以下是一个示例代码:

import pandas as pd

# 创建一个包含重复值的 DataFrame
data = {'col1': [1, 2, 2, 3, 4, 4, 5]}
df = pd.DataFrame(data)

# 对 col1 列进行去重
df_unique = df['col1'].drop_duplicates()

print(df_unique)

输出结果为:

0    1
1    2
3    3
4    4
6    5
Name: col1, dtype: int64

在这个示例中,我们创建了一个包含重复值的 DataFrame,并使用 'drop_duplicates()' 方法对 'col1' 列进行去重。最后,打印出去重后的结果。

注意:'drop_duplicates()' 方法默认会保留第一个出现的唯一值,如果想要保留最后一个出现的唯一值,可以使用 'keep='last'' 参数。

Pandas 某列去重:使用 drop_duplicates() 方法

原文地址: https://www.cveoy.top/t/topic/dUWe 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录