从文本中实时提取表情符号

时间:2018-10-13 14:46:50

标签: apache-spark elasticsearch apache-kafka apache-storm apache-nifi

我的文字流可能包含表情符号。我需要以接近实时的比例将其提取到数组中,然后将其存储在elasticsearch上。该流以每秒大约100条推文的速度在apani nifi中流动。

满足此需求的最佳或更好的解决方案/体系结构是什么?我有以下几个想法。

A)创建一个Web服务,从输入文本中提取表情符号,然后向其发送nifi流,然后收集响应。

method A

B)与上一步相同,另外使用apache kafka。

methid B

C)更改架构以使用Apache Spark或Storm或Flink的某些功能。

method C

D)Elasticsearch自定义映射?

0 个答案:

没有答案