JdbcIO或自定义接收器以使用特定的数据库批量实用程序

时间:2018-12-05 16:02:40

标签: google-cloud-dataflow apache-beam

我想知道为PostgreSQL数据库实现自定义接收器会多么复杂。从这个意义上讲,我想使用Java的复制管理器,而不是默认的1000个INSERT批。我相信这将导致更快的写入速度,因为我将使用Postgresql自己的数据加载实用程序。

1 个答案:

答案 0 :(得分:0)

就像编写自己的ParDo一样简单,它使用您喜欢的任何实用工具来实现功能:

JdbcIO的情况下,Write PTransformimplemented in under 200 lines,并且允许您configure the batch size,您可以使用它作为示例。

如果Beam用户可以从中受益,那么也请考虑contributing it into Beam