使用针对Google云数据流的自定义无限来源和阅读器进行动态工作重新平衡

时间:2017-06-20 21:50:22

标签: google-cloud-dataflow

我有自定义阅读器和自定义源的以下实现:

public class CustomPubsubReader扩展UnboundedReader {....}

public class CustomPubsubSource扩展UnboundedSource {....}

通过文档,似乎动态工作重新平衡仅适用于有界来源。

就我而言,我看到只创建了一个工作节点来从自定义源读取消息,即使消息队列正在接收1000个元素/ s。

例如,如果我使用PubsubIO.Read(),它将创建>在这种情况下,1个工作人员用于流模式。

在云数据流中使用自定义源时,有没有办法扩展?

谢谢!

1 个答案:

答案 0 :(得分:0)

UnboundedSource可以实现generateInitialSplits(数据流1.X)或split(数据流2.0)来为给定来源生成多个读者。

有关详细信息,请参阅Javadoc