Python Pandas 提取去除相邻相同数值的行
可以使用 Python 中的 pandas 库来提取去除相邻相同数值的行。具体步骤如下:
- 首先,导入 pandas 库并读取数据。假设数据保存在名为 'data.csv' 的文件中,可以使用以下代码读取数据:
import pandas as pd
data = pd.read_csv('data.csv', header=None)
- 接下来,使用 pandas 的
shift()函数来创建一个新的列,该列保存了与当前行相邻的下一行的数值。可以使用以下代码创建新的列:
data['next_value'] = data[0].shift(-1)
- 然后,使用 pandas 的
drop_duplicates()函数来去除相邻相同数值的行。可以使用以下代码实现:
data = data[data[0] != data['next_value']]
- 最后,删除新创建的列并保存结果。可以使用以下代码实现:
data = data.drop(columns=['next_value'])
data.to_csv('result.csv', header=False, index=False)
完整的代码如下:
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv', header=None)
# 创建新的列
data['next_value'] = data[0].shift(-1)
# 去除相邻相同数值的行
data = data[data[0] != data['next_value']]
# 删除新创建的列并保存结果
data = data.drop(columns=['next_value'])
data.to_csv('result.csv', header=False, index=False)
注意:在这个例子中,假设数据保存在名为 'data.csv' 的文件中,并且数据位于第一列。如果数据在其他列中,请根据实际情况调整代码中的列索引。
原文地址: https://www.cveoy.top/t/topic/fUzB 著作权归作者所有。请勿转载和采集!