Hive SQL: 使用窗口函数判断最近24小时内数据一致性
假设有一张表名为my_table,其中包含以下列:id,value和timestamp。
以下是使用 Hive SQL 按时间进行开窗函数的示例,以判断最近24小时内数据是否一致:
SELECT
id,
value,
timestamp,
CASE
WHEN COUNT(DISTINCT value) OVER (ORDER BY timestamp RANGE BETWEEN INTERVAL '24' HOUR PRECEDING AND CURRENT ROW) = 1 THEN 'consistent'
ELSE 'inconsistent'
END AS consistency_status
FROM
my_table;
这个查询将为每个行添加一个consistency_status列,该列将标识最近24小时内该行数据的一致性状态。如果value列的值在最近24小时内始终保持不变,则该行将被标记为'一致的',否则将被标记为'不一致的'。
原文地址: https://www.cveoy.top/t/topic/m1qF 著作权归作者所有。请勿转载和采集!