我是talend的新手并且在此方面经验非常有限, 我的任务需要在daliy的基础上执行从sql rds到redshift的每日增量更新, 但是我的工作是以非常慢的传输速度运行的 详情列于下方
我的sql rds查询是
SELECT
*
FROM
test.ankit2
WHERE
id > (SELECT COALESCE(max(id), 0) as id FROM test.stagetable)
ankit2是myrds中的表格 和 stagetable是redshift中的表格 并使用tmap组件将组件从rds输入链接到redshift输出组件 请看一下图片
请查看并提供您的建议 任何帮助将不胜感激 问候 ANKIT Talend Etl job
答案 0 :(得分:2)
要获得最佳的Redshift性能,请使用#ifndef __cplusplus
typedef int bool;
#endif
组件而不是tRedshiftOutputBulkExec
。它将使用选定的S3存储桶将数据存储为csv,并使用超高速tRedshiftOutput
命令(使用这种方法我设法达到20000行/秒的写入速度)。
如果可能的话,最好从RDS直接卸载到S3。