这段话说的是利用ETL工具,将分散在不同数据源中的不同类型的数据,如关系数据、平面数据文件等,提取到临时中间层进行清洗、转换、整合,最后将其加载到数据仓库或数据集市中,成为联机分析处理和数据挖掘的基础。同时,也可以将实时采集的数据作为流计算系统的输入,进行实时处理和分析。简单来说,就是通过ETL工具将分散在各处的数据整合到一起,并进行清洗和转换,以便用于分析和挖掘,同时也可以实时处理分析数据。

将这段话利用ETL工具将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成最后加载到数据仓库或数据集市中成为联机分析处理、数据挖掘的基础;或者也可以把实时采集的数据作为流计算系统的输入进行实时处理分析用自己的理解说一遍

原文地址: https://www.cveoy.top/t/topic/gRWk 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录