Spark RDD subtract() 方法解析:使用 num.subtract(num1).collect() 查找差异元素
给定'num = sc.parallelize([1, 2, 3])' 和 'num1 = sc.parallelize([4, 2, 3])','num.subtract(num1)' 将返回一个包含'num' 中不在 'num1' 中的元素的新 RDD。在这种情况下,'num' 中的元素是 '[1, 2, 3]',而 'num1' 中的元素是 '[4, 2, 3]'。
在执行 'num.subtract(num1)' 后,得到的结果是 '[1]',因为 'num' 中的元素 '1' 不在 'num1' 中。
最后,使用 '.collect()' 将结果从 RDD 转换为列表,所以 'num.subtract(num1).collect()' 的结果是 '[1]'。
原文地址: https://www.cveoy.top/t/topic/o0vy 著作权归作者所有。请勿转载和采集!