我是Flink和Elastic Search集成的新手。我有一种情况,我必须将历史数据(大约1TB)从旧的弹性搜索集群(5.6)加载到新集群(6.8)。在迁移期间,我必须进行一些数据过滤和修改。考虑将flink批处理作业与flink-es-sink运算符一起使用。
但是,由于当前没有可用的flink-es-source运算符,因此最好的方法是将数据提供到我的flink管道中。我有几种选择可以做到这一点。
但是不确定哪种方法最好,因为数据量很大,所以我可能必须并行化源运算符。
如果您遇到任何这种情况,请提出很少的选择。 预先感谢