Hive 执行计划解析:Stage-1 根阶段、Map Join 和 Select 操作
该 Hive 执行计划包括一个根阶段 (Stage-1) 和一个依赖于该根阶段的阶段 (Stage-0)。在根阶段中,有 4 个映射操作 (Map 1-4),其中 Map 1 是 TableScan 操作,读取名为 't1' 的表,并将其别名设置为 't1';Map 2-4 是 TableScan 操作,分别读取名为 't6'、't7' 和 't10' 的表,并将其别名设置为 't6'、't7' 和 't10'。在 Map 2-4 中,都包含一个 Filter 操作,用于过滤数据。在根阶段的最后一个操作是一个 Reduce Output 操作,用于限制输出结果数量。在阶段-0 中,有一个 File Output 操作,用于将结果输出到文件中。
该执行计划涉及多个 Map Join 操作,这些操作将不同的表连接起来,并使用 HybridGraceHashJoin 算法来优化性能。最后,该计划包括一个 Select 操作,用于选择输出结果的列,并对列进行转换和格式化。
原文地址: https://www.cveoy.top/t/topic/nQwI 著作权归作者所有。请勿转载和采集!