DWH和ETL解释道

时间:2015-01-29 15:11:42

标签: etl dimensional-modeling

在这篇文章中,我不是要求任何教程,如何做某事,在这篇文章中,我问你的帮助,如果有人可以用简单的词语解释我,什么是DWH(数据仓库)以及什么是ETL。 / p>

当然,我谷歌和youtube很多,我发现很多文章和视频,但我仍然不确定它是什么。

我为什么要问? 在申请工作之前,我需要非常清楚。

1 个答案:

答案 0 :(得分:3)

绝不应将此答案视为数据仓库的完整定义。这只是我试图用非专业人的术语来解释这个词。

事务(操作,OLTP)和分析(数据仓库)系统都可以使用与后端相同的RDBMS,它们可以包含完全相同的数据。但是,他们的数据模型将完全不同,因为它们针对不同的访问模式进行了优化

在交易系统中,您通常使用单行(例如客户或发票),并且写入一致性至关重要,因此数据模型已标准化。相反,数据仓库针对读取大量行(例如上一年的所有发票)和聚合数据进行了优化,因此维度平面化(星型模式,Kimball的维度和事实)。

交易系统仅存储当前版本的实体(即当前客户的地址),而数据仓库可以使用缓慢变化的维度(SCD)来保存历史记录(例如,具有日期范围的客户的所有地址,以指示每个地址的时间有效)。

ETL流程从事务系统中提取数据,将其转换为维度格式并加载到数据仓库中。