dataframe删除重复值

日期: 2028-07-17

标签: 时尚

可以使用pandas库中的drop_duplicates()函数来删除DataFrame中的重复值。

例如，假设我们有一个DataFrame df，其中有一列名为‘id’，我们想要删除其中的重复值，可以使用如下代码：

df.drop_duplicates(subset=['id'], inplace=True)

其中，subset参数指定需要检查重复值的列名，inplace参数表示在原DataFrame上进行修改，如果不设置该参数，则会返回一个新的DataFrame。

如果我们想要删除所有列中的重复值，可以不指定subset参数，如下所示：

df.drop_duplicates(inplace=True)

原文地址: https://www.cveoy.top/t/topic/fhsU 著作权归作者所有。请勿转载和采集!