Hive SQL 去重:DISTINCT 关键字的使用
在 Hive SQL 中,可以使用 'DISTINCT' 关键字去掉表的重复值。'DISTINCT' 关键字用于返回唯一不重复的记录。
例如,假设有一个名为 'table_name' 的表,包含以下数据:
id | name
---|------
1 | Alice
2 | Bob
3 | Alice
4 | Carol
要去掉 'name' 列中的重复值,可以使用以下语句:
SELECT DISTINCT name FROM table_name;
执行以上语句后,将返回以下结果:
name
-----
Alice
Bob
Carol
注意:'DISTINCT' 关键字会去掉所有列中的重复值,如果只想去掉特定列的重复值,可以在 'SELECT' 语句中只选择需要去重的列。
原文地址: https://www.cveoy.top/t/topic/pWRk 著作权归作者所有。请勿转载和采集!