dataframe删除重复值
可以使用pandas库中的drop_duplicates()函数来删除DataFrame中的重复值。
例如,假设我们有一个DataFrame df,其中有一列名为‘id’,我们想要删除其中的重复值,可以使用如下代码:
df.drop_duplicates(subset=['id'], inplace=True)
其中,subset参数指定需要检查重复值的列名,inplace参数表示在原DataFrame上进行修改,如果不设置该参数,则会返回一个新的DataFrame。
如果我们想要删除所有列中的重复值,可以不指定subset参数,如下所示:
df.drop_duplicates(inplace=True)
原文地址: https://www.cveoy.top/t/topic/fhsU 著作权归作者所有。请勿转载和采集!