为什么建数据仓库需要使用ETL工具?
原创

为什么建数据仓库需要使用ETL工具?

好文
试试语音读文章

热门回答:

数据仓库。是为企业所有级别的决策制定过程。提供所有类型数据支持的战略集合。它是单个数据存储。出于分析性报告和决策支持目的而创建。既然要获取全部数据。必然涉及到多系统。各类型数据库的对接问题。还有数据抽取、整理的问题。

这时候ETL工具的作用就集中体现出来了。数据的抽取、转换、加载直到供人们去分析使用。ETL就是数据抽取、转换、加载的过程。

有些地方可能选择的是ELT。先加载在转换。对数仓来说。ETL首先要考虑业务需求。最后数据落地模型。要体现某种主题。

然后从数据源考虑哪些字段是可以用的。在进行ETL。现在ETL工具很多。所以编程能力很难在这方面体现出来。对于公司来说。更看重的是ETL的思路。通俗的想。数据仓库就像大水池。给水池蓄水需要泵和水管。那ETL就是承担泵和水管的功能。

其他观点:

二、ETL的组成部分

(一) 数据的抽取(Extract)

(二)数据的清洗转换(Cleaning、Transform)

(三) 数据加载(Load)

三、ETL 实现方式

借助ETL工具:**(如Oracle的OWB、SQL Server 2000的DTS、SQL Server2005的SSIS服务、Informatic等)实现。

SQL方式实现:**SQL的方法优点是灵活。提高ETL运行效率。但是编码复杂。对技术要求比较高。

ETL工具和SQL相结合**。前两种方法各有各的优缺点。借助工具可以快速的建立起ETL工程。屏蔽了复杂的编码任务。提高了速度。降低了难度。综合了前面二种的优点。会极大地提高ETL的开发速度和效率。

四、数据仓库ODS、DW和DM概念区分


其他观点:

为什么会出现数据仓库?没有数据仓库时。我们需要直接从业务数据库中取数据来做分析。虽然可以用于分析。但需要做很多额外的调整。在我看来。主要有以下几个问题:结构复杂。数据脏乱。难以理解。缺少历史。大规模查询缓慢。

然后数据仓库就出现了。各种数据都有结构、有规模地在一起。做决策更有一套。

什么是ETL?简单来说。如果把数据分析类比成做菜。ETL相当于备菜。

数据仓库是单个数据存储。出于分析性报告和决策支持目的而创建。既然要获取全部数据。必然涉及到多系统。各类型数据库的对接问题。还有数据抽取、整理的问题。

这时候ETL工具的作用就集中体现出来了。数据的抽取、转换、加载直到供人们去分析使用。

通俗的想。数据仓库就像大水池。给水池蓄水需要泵和水管。那ETL就是承担泵和水管的功能。

您还感兴趣的文章推荐

以上就是由互联网推广工程师 网创网 整理编辑的,如果觉得有帮助欢迎收藏转发~

分享到 :
相关推荐

发表评论

您的电子邮箱地址不会被公开。

评论(2)

  • 退到无路可退 永久VIP 2022年12月28日 10:25:45

    数据,数据仓库,工具,水管,加载,的是,目的,就像,数据库,涉及到

  • 樱花吻 永久VIP 2022年12月28日 10:25:45

    没想到大家都对为什么建数据仓库需要使用ETL工具?感兴趣,不过这这篇解答确实也是太好了

  • 孤飘的蒲公英 永久VIP 2022年12月28日 10:25:45

    数据仓库。是为企业所有级别的决策制定过程。提供所有类型数据支持的战略集合。它是单个数据存储。出于分析性报告和决策支持目的