pandas 去重
在pandas中,可以使用drop_duplicates()方法来去除DataFrame或Series中的重复值。
对于DataFrame,可以根据指定的列或行进行去重。例如,假设有一个DataFrame df,其中有两列col1和col2,想要根据这两列的值进行去重,可以使用以下代码:
df.drop_duplicates(subset=['col1', 'col2'], inplace=True)
subset参数用于指定要考虑的列。inplace=True表示在原始DataFrame上进行操作,如果不需要修改原始DataFrame,可以省略该参数。
对于Series,可以直接调用drop_duplicates()方法进行去重。例如,假设有一个Series s,想要去除其中的重复值,可以使用以下代码:
s.drop_duplicates(inplace=True)
与DataFrame类似,inplace=True表示在原始Series上进行操作,如果不需要修改原始Series,可以省略该参数。
原文地址: https://www.cveoy.top/t/topic/ilXB 著作权归作者所有。请勿转载和采集!