要在pandas中对某列进行去重,可以使用drop_duplicates()方法。这个方法会返回一个新的DataFrame,其中包含指定列的唯一值。

以下是一个示例代码:

import pandas as pd

# 创建一个包含重复值的DataFrame
data = {'col1': [1, 2, 2, 3, 4, 4, 5]}
df = pd.DataFrame(data)

# 对col1列进行去重
df_unique = df['col1'].drop_duplicates()

print(df_unique)

输出结果为:

0    1
1    2
3    3
4    4
6    5
Name: col1, dtype: int64

在这个示例中,我们创建了一个包含重复值的DataFrame,并使用drop_duplicates()方法对col1列进行去重。最后,打印出去重后的结果。

注意:drop_duplicates()方法默认会保留第一个出现的唯一值,如果想要保留最后一个出现的唯一值,可以使用keep='last'参数。

pandas 某列去重

原文地址: https://www.cveoy.top/t/topic/iYKv 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录