我对Talend提供的不同产品感到困惑。
Talend Open Studio for Data Integration
和Talend Open Studio for Big Data
似乎是相同的产品,但默认情况下只安装了不同的组件。是对的吗?如果我使用Talend Open Studio进行数据集成并从Talend Exchange下载我需要的组件(例如Google BigQuery),它是否真的是同一产品?
答案 0 :(得分:9)
除了不同的连接器,它们在一个关键点上有所不同,它们产生的代码库。
Talend Open Studio for Data Integration生成Java代码,而Talend Open Studio for Big Data可以生成map reduce代码和Java代码。
请参阅here,了解Talend的大数据产品示例,了解如何生成地图缩减代码作业。
答案 1 :(得分:1)
不仅仅是组件:
来自:http://www.talend.com/products/data-integration
功能:作业设计师,作业设计师,450多个连接器,版本控制
来自:http://www.talend.com/products/big-data
功能:作业设计师,HDFS组件,HBase,HCatalog,Hive, Pig,Sqoop,Hadoop Job Scheduler,NoSQL支持
我不确定,但我不认为官方组件可以在Talend的交换网站上找到。在那里,您只能找到社区贡献的组件。
答案 2 :(得分:0)
在Talend Open Studio for Data Integration中,您可以创建标准作业(意味着您可以直接使用DI组件,并在后面生成Java代码)。
但Talend Open Studio for Big Data你可以选择创建map / reduce作业(意味着在背面地图/减少代码[实际上是java map / reduce]代码)。在map / reduce作业中,所有组件都在talend服务器中运行map和reduce任务。与tmap组件类似,您可以在组件执行时看到map和reduce任务栏。
答案 3 :(得分:0)
Talend没有区分连接器.Spark是TOS和许可版本之间的差异。
Open studio不支持批量和实时火花。
答案 4 :(得分:0)
Talend针对不同的需求提供了不同的Open Studio产品。
Talend数据集成操作系统-满足数据集成/ ETL要求。这将没有特定于大数据的组件。
面向大数据的Talend OS-满足大数据需求。您可以连接到Hadoop,Hive和其他大数据组件。除了生成Java代码之外,还可以生成map reduce代码。
您还拥有满足ESB,MDM和数据质量的Talend OS,可以满足不同的需求。