ETL中的分层数据

时间:2011-09-19 12:25:16

标签: etl pentaho

我是ETL工具的新手,但我发现他们评估的是他们都使用平行模型。即如果你的数据需要一些图形对象转换(即检查父字段或其他依赖性),则非常不方便(可以通过非规范化等来解决映射到更简单的RDB模型)。我想问一下我是否理解正确。为什么ETL避免使用更易理解的面向业务对象的模型。是否有ETL支持与文档相关或与OOP相关的转换?

2 个答案:

答案 0 :(得分:1)

我不确定我是否完全理解这个问题,但需要考虑一些想法:

  • 大多数ETL范例来自数据集成和决策支持领域,即来自数据仓库的设计和实现。这个世界传统上是面向关系数据库的,大多数数据源都是作为数据库表或CSV文件存在的。这可能是"平行模型"的原因。
  • 简单数据模型对于高吞吐量性能非常有用,并且在大多数情况下不会过度限制:ETL工具用于大量数据密集型任务。
  • 我所知道的大多数工具都假设源记录是彼此独立处理的,它们不会相互影响。然而,情况并非总是如此,因为一些工具允许例如聚合数据(例如,Informatica聚合器元素) - 数据模型不再那么平坦。
  • 扩展平面模型的其他示例包括检查外键依赖项("父字段"),使用字典表(甚至是Web服务),定义外部类进行任意操作(" OOP& #34;)等。但是,ETL数据模型始终保持较低的抽象级别。

答案 1 :(得分:0)

Altova MapForce可以处理分层数据。