我被要求创建一个ETL样式的应用程序,将信息从一个数据源传输到另一个数据源。目前,我已决定使用三层架构,但我想了解更多关于此维基百科页面上描述的最佳实践和生命周期的信息:
http://en.wikipedia.org/wiki/Extract,_transform,_load
ETL架构设计的四层方法
现实生活中的ETL周期
典型的实际ETL循环包括以下执行步骤:
答案 0 :(得分:6)
我不知道你的情况是什么或你的要求是什么,但你可能会过度思考这个问题。
仅这个名称就是“架构”:
将数据库表导出为CSV可以视为“ET”,而加载CSV时则为“L”。大多数ETL问题并不复杂。
除此之外,您应该获取Java,免费和商业,图书馆和全船处理系统中已有的1或2百万个ETL和ESB软件包中的任何一个,并且只需采用您最喜欢的一个。
获得一块白板,将一些气泡与线条串在一起,然后将其转入代码。
答案 1 :(得分:1)
要回答这个问题,"最佳做法是什么?"答案取决于你想要完成的事情。
为了简化,我们假设您正在执行以下操作之一:
当我使用"重组"时,我的意思是改变表格的颗粒或最低细节水平。
For 1.通常会遵循您的问题中列出的十个步骤。一般最佳实践:
For 2.这样更简单,因此可以使用您问题中列出的任何一种方法。