数仓分层中ads层主要存放的数据是什么
在数仓分层中,ADS层(Analytical Data Store)主要存放经过清洗、集成、加工、汇总等处理的数据,用于支持数据分析和报表生成等决策支持需求。
ADS层存放的数据包括但不限于以下类型:
-
经过清洗和集成的源数据:从各个数据源提取的原始数据经过清洗、整合和转换后的数据,用于建立一致的数据模型和数据质量的保障。
-
汇总和聚合数据:将原始数据进行聚合和汇总,以满足特定的分析需求。例如,按照时间维度进行日/周/月/季度/年的汇总数据,或者按照地理维度进行区域的聚合数据等。
-
衍生数据:通过对原始数据进行计算、加工和推导得到的衍生数据,用于支持更高级别的分析和决策需求。例如,计算销售额、利润率、增长率等指标,或者进行数据挖掘和机器学习等高级分析。
-
维度表和事实表:将数据进行维度建模,包括维度表和事实表。维度表包含描述业务实体的属性,如产品、客户、时间、地理位置等;事实表则包含与业务实体相关的度量指标,如销售额、订购数量、点击量等。
-
中间结果数据:在数据加工过程中生成的中间结果数据,用于支持数据处理的流程控制和数据质量的检测。
-
与业务分析相关的元数据:包括数据字典、数据血统、数据质量规则、数据模型等,用于支持数据分析人员了解数据的含义、关系和质量情况。
总之,ADS层存放的数据是经过处理和加工的、可用于数据分析和决策支持的数据,提供一致、可靠、易用的数据资源给数据分析师、数据科学家、业务用户等进行数据挖掘、分析和报表生成等工作
原文地址: http://www.cveoy.top/t/topic/isoH 著作权归作者所有。请勿转载和采集!