在Talend上使用Amazon EMR运行Hive或Spark?

时间:2017-12-07 21:56:56

标签: amazon-web-services hive talend

我正在尝试使用Talend在Amazon AWS上运行配置单元查询。到目前为止,我可以使用 tAmazonEMRManage 对象在AWS上创建集群,接下来的步骤将是 1)使用数据加载表 2)对表运行查询。

我的数据位于S3。到目前为止,关于talend的文档似乎并未表明Hive对象 tHiveLoad tHiveRow 支持S3,这使得我想知道是否可以通过Talend在EMR上运行配置单元查询

关于如何做到这一点的文件很少。有没有人尝试过这样做,或者能指出我正确的方向吗?

0 个答案:

没有答案