我有以下设置(我无法改变),我希望那些走在那条路上的人提出一些建议。我不确定这是否是正确的问题,但无论如何都要进行。
我看过Spark Streaming但它没有JMS适配器,据我所知,对JSON的操作将会完成using a SQLContext instance on the DStream's RDDs。我知道可以编写自定义适配器,但是我不确定Spark是否仍然是最好/最简单的解决方案。我也查看了Samza和Flink的文档,但对于JMS和/或JSON没有太多信息,至少不是本地的。
Apache Camel似乎可能拥有大量的连接器,但我对它并不太熟悉,而且我得到的印象是它没有做流媒体部分,'只是'你连接到各种系统的位置。还有Akka,虽然我得到的印象是它更像是消息传递系统的替代品并且设置了JMS。
有一些令人费解的可用工具,我现在处于亏损状态,无论要注意什么或需要注意什么。根据您用于获取消息,转换并插入Hive和MySQL的经验,您会推荐什么?