Talend作业运行速度慢

时间:2016-02-15 08:05:11

标签: amazon-web-services amazon-redshift talend aws-rds

我是talend的新手并且在此方面经验非常有限, 我的任务需要在daliy的基础上执行从sql rds到redshift的每日增量更新, 但是我的工作是以非常慢的传输速度运行的 详情列于下方

我的sql rds查询是

SELECT
    *  
FROM
    test.ankit2 
WHERE
    id > (SELECT COALESCE(max(id), 0) as id FROM test.stagetable)

ankit2是myrds中的表格 和 stagetable是redshift中的表格 并使用tmap组件将组件从rds输入链接到redshift输出组件 请看一下图片

请查看并提供您的建议 任何帮助将不胜感激 问候 ANKIT Talend Etl job

1 个答案:

答案 0 :(得分:2)

要获得最佳的Redshift性能,请使用#ifndef __cplusplus typedef int bool; #endif 组件而不是tRedshiftOutputBulkExec。它将使用选定的S3存储桶将数据存储为csv,并使用超高速tRedshiftOutput命令(使用这种方法我设法达到20000行/秒的写入速度)。

如果可能的话,最好从RDS直接卸载到S3。