我曾在Informatica Power Center工作。我认为Informatica是最佳的ETL,因为它易于进行转换,并且具有单独的组件(存储库,用于运行作业的工作流,Designer Studio(映射设计器,源分析器,目标设计器,转换开发器,Mapplet设计器)),每个都可满足特定目的。 / p>
但是,在Talend中,我发现在Talend中使用转换(也称为组件)并不容易。虽然,所有东西都包裹在一个单独的货盘中,但没有别的设计师的东西,但是很难使用。即使是小的映射(如将数据从文件加载到表中),也需要花费很长时间才能构建。
In Talend
Source
(Built In (Manual and is
local)/
Repository (MetaData)
-> Tmap
(to map/transform/join two
or more sources)
-> TDBOutput
(For this you need to
have a TDBConnection
component as
well)
这看起来都需要1到2步,但是每次配置一次又一次都需要花费时间。另外,假设除了上述id序列之外,还要检查目标是否存在重复性,这将变得非常困难。我做了很多搜索,终于通过Numeric.sequence... function in Expression Editor of rows in Tmap
做到了。
在Informatica中,它更加清晰 源-> lkp(目标)->序列 生成器->目标
因此,最好与Talend或Informatica一起使用,特别是对于ETL。我知道Talend生成Java,而Informatica生成Sql是主要区别。数据集成方面的任何其他差异都使Talend优于Informatica
答案 0 :(得分:0)
不幸的是,它并不像“哪种工具更适合ETL”那样简单
简而言之,它们都是用于数据集成的好工具。他们每个人都有学习曲线,最终决定可能会取决于其他因素,例如可用的技能和许可成本。
要进行全面比较,您应该使用Talend的许可企业版本,而不是OpenStudio版本。
以下是这两种工具的一些比较:
Informatica通常会拉出所有来源和所有来源的所有行 同时进行查找,然后对其进行处理,这可能非常 高效。另一方面,Talend是逐行工作的, 通过管道传递行。 您可以在每个工具中实现相反的行为,但这是默认行为。
Informatica具有由Talend的tMap
表示的几个组件。这可能只是您所熟悉的一个问题,它们同样有效。 tMap
完成Joiner
,Filter
,Lookup
,Router
和Expression
转换的工作。
Informatica使用组件之间的连线表示各个字段,因此具有10个字段的表将产生10条连线来连接各个组件。在Talend中,导线代表整个记录。同样,每种方法都有好处。
Talend是较新的技术,而今天的Informatica PowerCenter与十年前非常相似。这意味着Talend将可能支持更多现代技术,而Informatica将具有成熟性和稳定性。
Talend可以成为Java开发人员的强大工具,因为他们可以利用本机Java功能。 Informatica确实支持Java转换,并且可以利用这些转换来做一些漂亮的事情。
Informatica的许多功能在Talend的免费版本中不容易复制,但在Talend管理控制台的许可版本中却存在。例如,尽管您可以从Talend的职位中调用职位,但是最好以与Informatica中的职位经理类似的方式从TAC协调这种行为。
Talend支持动态模式(即表结构),在这种模式下,您可以通过管道提取记录,而无需在编译时知道列。这是许可版本的功能。
Talend作业可以编译为一个独立的Java应用程序,您可以将其部署在任何地方。他们不需要服务器或任何东西。这是一个方便的功能,但在需要部署和监视的企业环境中使用可能有限。
这两个工具都有非常特定于工具的源代码控制。 Informatica具有自己的版本控制,而Talend将其版本控制堆叠在Git或SVN之上。这是两个工具中的一项许可功能。