pandas和nampy获取第一列不在第二列出现的数字
要获取第一列中不在第二列中出现的数字,可以使用pandas和numpy库的函数进行操作。
首先,使用pandas库的read_csv函数读取包含数据的csv文件,并将数据存储在一个DataFrame对象中。假设第一列的名称为"col1",第二列的名称为"col2"。
import pandas as pd
# 读取包含数据的csv文件
data = pd.read_csv("data.csv")
# 获取第一列和第二列的数据
col1 = data["col1"]
col2 = data["col2"]
# 使用pandas库的isin函数获取第一列中不在第二列中出现的数字
result = col1[~col1.isin(col2)]
# 打印结果
print(result)
然后,使用numpy库的setdiff1d函数获取第一列中不在第二列中出现的数字。
import numpy as np
# 将第一列和第二列的数据转换为numpy数组
col1_array = np.array(col1)
col2_array = np.array(col2)
# 使用numpy库的setdiff1d函数获取第一列中不在第二列中出现的数字
result = np.setdiff1d(col1_array, col2_array)
# 打印结果
print(result)
以上代码分别使用pandas和numpy库的函数获取第一列中不在第二列中出现的数字,并将结果打印出来。
原文地址: https://www.cveoy.top/t/topic/jfv8 著作权归作者所有。请勿转载和采集!