20道Spark单项选择题及答案
- 下列哪个不是Spark的特点? A. 分布式计算 B. 快速处理大数据 C. 支持多种编程语言 D. 仅支持批处理
答案:D
- Spark最初是在哪个大学开发的? A. 斯坦福大学 B. 麻省理工学院 C. 哈佛大学 D. 加州大学伯克利分校
答案:D
- Spark的核心组件是什么? A. Spark SQL B. Spark Streaming C. Spark Core D. Spark MLlib
答案:C
- 下列哪个不是Spark的编程语言? A. Java B. Python C. C++ D. Scala
答案:C
- Spark的RDD是什么? A. 一种数据结构 B. 一种分布式文件系统 C. 一种编程语言 D. 一种数据库
答案:A
- 在Spark中,什么是DAG? A. 一种数据结构 B. 一种编程语言 C. 一种调度器 D. 一种分布式文件系统
答案:A
- Spark的哪个组件可以用于处理实时数据流? A. Spark SQL B. Spark Streaming C. Spark Core D. Spark MLlib
答案:B
- Spark的哪个组件可以用于处理机器学习任务? A. Spark SQL B. Spark Streaming C. Spark Core D. Spark MLlib
答案:D
- 在Spark中,什么是Shuffle? A. 数据的重新分区 B. 数据的排序 C. 数据的过滤 D. 数据的聚合
答案:A
- 在Spark中,什么是Partition? A. 数据的分区 B. 数据的排序 C. 数据的过滤 D. 数据的聚合
答案:A
- 在Spark中,什么是Action? A. 触发Spark计算的操作 B. 转换RDD的操作 C. 过滤RDD的操作 D. 排序RDD的操作
答案:A
- 在Spark中,什么是Transformation? A. 转换RDD的操作 B. 触发Spark计算的操作 C. 过滤RDD的操作 D. 排序RDD的操作
答案:A
- 在Spark中,什么是Narrow Dependency? A. 一个父RDD分区只对应一个子RDD分区 B. 一个父RDD分区对应多个子RDD分区 C. 多个父RDD分区对应一个子RDD分区 D. 一个父RDD分区不依赖任何子RDD分区
答案:A
- 在Spark中,什么是Wide Dependency? A. 一个父RDD分区对应多个子RDD分区 B. 一个父RDD分区只对应一个子RDD分区 C. 多个父RDD分区对应一个子RDD分区 D. 一个父RDD分区不依赖任何子RDD分区
答案:A
- 在Spark中,什么是持久化? A. 将RDD缓存到内存或磁盘中 B. 将RDD转换为DataFrame C. 将RDD转换为DataSet D. 将RDD转换为SQL表
答案:A
- 在Spark中,什么是Broadcast变量? A. 可以在所有节点上共享的只读变量 B. 可以在所有节点上共享的可读写变量 C. 只能在一个节点上使用的变量 D. 只能在一个线程上使用的变量
答案:A
- 在Spark中,什么是累加器? A. 可以在所有节点上共享的可读写变量 B. 可以在所有节点上共享的只读变量 C. 只能在一个节点上使用的变量 D. 只能在一个线程上使用的变量
答案:A
- 在Spark中,什么是Driver程序? A. 运行Spark应用程序的主程序 B. 运行Spark应用程序的从程序 C. 运行Spark应用程序的调度器 D. 运行Spark应用程序的计算节点
答案:A
- 在Spark中,什么是Executor? A. 运行Spark应用程序的计算节点 B. 运行Spark应用程序的主程序 C. 运行Spark应用程序的从程序 D. 运行Spark应用程序的调度器
答案:A
- 在Spark中,什么是Cluster Manager? A. 管理Spark应用程序的计算资源 B. 管理Spark应用程序的数据存储 C. 管理Spark应用程序的网络连接 D. 管理Spark应用程序的安全性
答案:
原文地址: https://www.cveoy.top/t/topic/frHF 著作权归作者所有。请勿转载和采集!