Talend for Data Integration与Informatica Power Center

时间:2019-06-08 08:22:49

标签: talend informatica informatica-powercenter

我曾在Informatica Power Center工作。我认为Informatica是最佳的ETL,因为它易于进行转换,并且具有单独的组件(存储库,用于运行作业的工作流,Designer Studio(映射设计器,源分析器,目标设计器,转换开发器,Mapplet设计器)),每个都可满足特定目的。 / p>

但是,在Talend中,我发现在Talend中使用转换(也称为组件)并不容易。虽然,所有东西都包裹在一个单独的货盘中,但没有别的设计师的东西,但是很难使用。即使是小的映射(如将数据从文件加载到表中),也需要花费很长时间才能构建。

        In  Talend 

   Source
          (Built In (Manual and is 
          local)/ 
          Repository (MetaData)
  -> Tmap 
           (to map/transform/join two 
             or more sources)
  ->  TDBOutput
              (For this you need to 
              have a TDBConnection 
               component as 
             well)

这看起来都需要1到2步,但是每次配置一次又一次都需要花费时间。另外,假设除了上述id序列之外,还要检查目标是否存在重复性,这将变得非常困难。我做了很多搜索,终于通过Numeric.sequence... function in Expression Editor of rows in Tmap做到了。

在Informatica中,它更加清晰            源-> lkp(目标)->序列           生成器->目标

因此,最好与Talend或Informatica一起使用,特别是对于ETL。我知道Talend生成Java,而Informatica生成Sql是主要区别。数据集成方面的任何其他差异都使Talend优于Informatica

1 个答案:

答案 0 :(得分:0)

不幸的是,它并不像“哪种工具更适合ETL”那样简单

简而言之,它们都是用于数据集成的好工具。他们每个人都有学习曲线,最终决定可能会取决于其他因素,例如可用的技能和许可成本。

要进行全面比较,您应该使用Talend的许可企业版本,而不是OpenStudio版本。

以下是这两种工具的一些比较:

  • Informatica通常会拉出所有来源和所有来源的所有行 同时进行查找,然后对其进行处理,这可能非常 高效。另一方面,Talend是逐行工作的, 通过管道传递行。 您可以在每个工具中实现相反的行为,但这是默认行为。

  • Informatica具有由Talend的tMap表示的几个组件。这可能只是您所熟悉的一个问题,它们同样有效。 tMap完成JoinerFilterLookupRouterExpression转换的工作。

  • Informatica使用组件之间的连线表示各个字段,因此具有10个字段的表将产生10条连线来连接各个组件。在Talend中,导线代表整个记录。同样,每种方法都有好处。

  • Talend是较新的技术,而今天的Informatica PowerCenter与十年前非常相似。这意味着Talend将可能支持更多现代技术,而Informatica将具有成熟性和稳定性。

  • Talend可以成为Java开发人员的强大工具,因为他们可以利用本机Java功能。 Informatica确实支持Java转换,并且可以利用这些转换来做一些漂亮的事情。

  • Informatica的许多功能在Talend的免费版本中不容易复制,但在Talend管理控制台的许可版本中却存在。例如,尽管您可以从Talend的职位中调用职位,但是最好以与Informatica中的职位经理类似的方式从TAC协调这种行为。

  • Talend支持动态模式(即表结构),在这种模式下,您可以通过管道提取记录,而无需在编译时知道列。这是许可版本的功能。

  • Talend作业可以编译为一个独立的Java应用程序,您可以将其部署在任何地方。他们不需要服务器或任何东西。这是一个方便的功能,但在需要部署和监视的企业环境中使用可能有限。

  • 这两个工具都有非常特定于工具的源代码控制。 Informatica具有自己的版本控制,而Talend将其版本控制堆叠在Git或SVN之上。这是两个工具中的一项许可功能。