Hive SQL 去重：DISTINCT 关键字的使用

在 Hive SQL 中，可以使用 'DISTINCT' 关键字去掉表的重复值。'DISTINCT' 关键字用于返回唯一不重复的记录。

例如，假设有一个名为 'table_name' 的表，包含以下数据：

id | name
---|------
1  | Alice
2  | Bob
3  | Alice
4  | Carol

要去掉 'name' 列中的重复值，可以使用以下语句：

SELECT DISTINCT name FROM table_name;

执行以上语句后，将返回以下结果：

name
-----
Alice
Bob
Carol

注意：'DISTINCT' 关键字会去掉所有列中的重复值，如果只想去掉特定列的重复值，可以在 'SELECT' 语句中只选择需要去重的列。