Spark RDD操作:num. (num1).collect()详解
已知 num = sc.parallelize([1, 2, 3]),num1 = sc.parallelize([4, 2, 3]),那么 num. (num1).collect() 得到的结果的解析内容如下:
-
num = sc.parallelize([1, 2, 3]) 创建了一个RDD对象,其中包含元素 1、2、3。
-
num1 = sc.parallelize([4, 2, 3]) 创建了另一个RDD对象,其中包含元素 4、2、3。
-
'.' 操作符用于对RDD对象执行操作。
-
在这个情况下,num. (num1) 表示对 num 这个RDD对象执行 (num1) 操作。
-
collect() 是一个动作操作,用于将RDD对象中的所有元素收集到一个列表中。
-
因此,num. (num1).collect() 的结果是 [4, 2, 3],即 num1 这个RDD对象的所有元素。
原文地址: https://www.cveoy.top/t/topic/o0vn 著作权归作者所有。请勿转载和采集!