1. Spark是一种什么类型的计算框架? A. 分布式计算框架 B. 单机计算框架 C. 数据库管理框架 D. 机器学习框架 答案:A

  2. Spark SQL是Spark的哪个组件? A. Spark Streaming B. Spark MLlib C. Spark GraphX D. Spark Core 答案:D

  3. 在Spark中,使用什么命令可以读取出租车数据并创建一个DataFrame? A. spark.read.csv() B. spark.read.json() C. spark.read.parquet() D. spark.read.text() 答案:A

  4. 在Spark中,使用什么命令可以将DataFrame转换为RDD? A. df.toRDD() B. df.rdd() C. df.map() D. df.flatMap() 答案:B

  5. 在Spark中,使用什么命令可以计算出租车数据中每个月的总收入? A. df.groupBy("month").sum("income") B. df.filter("month").agg(sum("income")) C. df.select("month", "income").groupBy("month").sum() D. df.map(lambda x: (x.month, x.income)).reduceByKey(lambda x, y: x + y) 答案:

出5道关于Spark 出租车数据分析的选择题并给出答案

原文地址: https://www.cveoy.top/t/topic/fQPG 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录