我的文字流可能包含表情符号。我需要以接近实时的比例将其提取到数组中,然后将其存储在elasticsearch上。该流以每秒大约100条推文的速度在apani nifi中流动。
满足此需求的最佳或更好的解决方案/体系结构是什么?我有以下几个想法。
A)创建一个Web服务,从输入文本中提取表情符号,然后向其发送nifi流,然后收集响应。
B)与上一步相同,另外使用apache kafka。
C)更改架构以使用Apache Spark或Storm或Flink的某些功能。
D)Elasticsearch自定义映射?