我们一直在使用Cascading框架来创建ETL。
级联给出。
现在我们有两个选项将一些X ETL(成本很高)的工作转换为hadoop工作
我的问题是。
将X ETL转换为级联工作流将需要创建给定X ETL中可用的所有组件,但这将是一次性活动。然后我们需要考虑Talend Studio提供的其他功能,如:
a. Data quality.
b. Data Profiling.
c. Data lineage, etc.
底线是我正在创建一个从X ETL到hadoop作业的转换工具。 我需要从Cascading框架或Talend中选择。
答案 0 :(得分:0)
我无法回答你的所有问题,但我可以给你回报经验。 Talend开发比From wark或本地语言最有效,并且源代码最容易维护,因为组件已经过优化,而且您的Job的IDE非常清晰。 debuging功能很好,你可以做步骤调试,你可以生成源代码。
对我而言,不方便的是配置管理,Talend与许多分支机构合作并不是很成功。