Flink弹性搜索源连接器

时间:2020-09-10 04:46:44

标签: elasticsearch apache-flink flink-streaming flink-batch

我是Flink和Elastic Search集成的新手。我有一种情况,我必须将历史数据(大约1TB)从旧的弹性搜索集群(5.6)加载到新集群(6.8)。在迁移期间,我必须进行一些数据过滤和修改。考虑将flink批处理作业与flink-es-sink运算符一起使用。

但是,由于当前没有可用的flink-es-source运算符,因此最好的方法是将数据提供到我的flink管道中。我有几种选择可以做到这一点。

  1. 编写平面图函数/过程函数并获取记录
  2. 使用一些开源的第三方库将flink连接到ES。但是不想冒险,因为不知道这些程序的执行情况

但是不确定哪种方法最好,因为数据量很大,所以我可能必须并行化源运算符。

如果您遇到任何这种情况,请提出很少的选择。 预先感谢

0 个答案:

没有答案