如果我在表输入步骤中使用连接,这是使用ETL的好方法吗?

时间:2015-11-15 10:07:24

标签: join etl data-warehouse

我想知道在我的转换中的表输入步骤中使用连接(在我的情况下,我使用3个连接来获取所需的值)是否是使用ETL的正确方法。或者,还有更好的方法?谢谢您的帮助。

1 个答案:

答案 0 :(得分:1)

通常情况如此:答案取决于您的环境。例如,如果您有一个快速变化的源系统和许多具有较长持续时间的转换,首先将所需信息复制到临时数据库可以帮助您通过所涉及的所有转换创建可重现的结果。在这种情况下,直接连接源系统中的表可以为两个一个接一个地运行的转换创建不同的结果。

如果您的源系统的时间范围没有太大变化或根本没有变化 - 或者如果您只需要在此单一变换中获取该信息 - 加入表格可能完全没有问题。

从技术角度来看,没有什么可以反对连接(实际上存在 连接的参数,尤其是性能)。可理解性是另一回事,在这里,您的具体环境也很重要。 ETL过程通常记录得很糟糕,并且在多年前由其他人创建的转换工作可能既简单又完全痛苦。如果您的连接从技术角度来看是有意义的,并且您从一致的来源获取数据,我不明白为什么您不应该使用它们。它们应始终比ETL转换中的查找步骤快得多。