pandas 某列去重

要在pandas中对某列进行去重，可以使用drop_duplicates()方法。这个方法会返回一个新的DataFrame，其中包含指定列的唯一值。

以下是一个示例代码：

import pandas as pd

# 创建一个包含重复值的DataFrame
data = {'col1': [1, 2, 2, 3, 4, 4, 5]}
df = pd.DataFrame(data)

# 对col1列进行去重
df_unique = df['col1'].drop_duplicates()

print(df_unique)

输出结果为：

0    1
1    2
3    3
4    4
6    5
Name: col1, dtype: int64

在这个示例中，我们创建了一个包含重复值的DataFrame，并使用drop_duplicates()方法对col1列进行去重。最后，打印出去重后的结果。

注意：drop_duplicates()方法默认会保留第一个出现的唯一值，如果想要保留最后一个出现的唯一值，可以使用keep='last'参数。