可以使用pandas库中的drop_duplicates()函数来删除DataFrame中的重复值。

例如,假设我们有一个DataFrame df,其中有一列名为‘id’,我们想要删除其中的重复值,可以使用如下代码:

df.drop_duplicates(subset=['id'], inplace=True)

其中,subset参数指定需要检查重复值的列名,inplace参数表示在原DataFrame上进行修改,如果不设置该参数,则会返回一个新的DataFrame。

如果我们想要删除所有列中的重复值,可以不指定subset参数,如下所示:

df.drop_duplicates(inplace=True)
dataframe删除重复值

原文地址: https://www.cveoy.top/t/topic/fhsU 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录