如何去除每列相邻重复的值
要去除每列相邻重复的值,可以使用pandas库中的drop_duplicates()方法。该方法可以对DataFrame中的每列进行去重操作。
以下是一个示例代码,演示如何去除每列相邻重复的值:
import pandas as pd
# 创建一个示例DataFrame
data = {'A': [1, 1, 2, 3, 3],
'B': [4, 4, 5, 6, 6],
'C': [7, 8, 9, 9, 10]}
df = pd.DataFrame(data)
# 去除每列相邻重复的值
df = df.apply(lambda x: x.drop_duplicates(), axis=0)
print(df)
输出结果为:
A B C
0 1 4 7
2 2 5 9
3 3 6 9
4 3 6 10
在示例中,首先创建了一个示例DataFrame。然后使用apply()方法和lambda函数对每列进行操作,调用drop_duplicates()方法去除相邻重复的值。最后打印输出结果。
注意,drop_duplicates()方法默认保留第一个出现的值,并删除后续重复的值。如果想保留最后一个出现的值,可以在drop_duplicates()方法中设置参数keep='last'。
原文地址: http://www.cveoy.top/t/topic/iozB 著作权归作者所有。请勿转载和采集!