我对大数据世界很陌生,经过几个小时的阅读和记录,我决定寻求你的建议。这是合约:
我需要对来自mongoDB 集合的数据执行实时分析。我的分析器必须用解释语言编写(最好用 Python )。
根据我的阅读, spark-streaming 看起来就像一见钟情的完美工具。但至少在Python中,根据doc从mongoDB创建输入DStream似乎是不可能的。有没有其他选择,比如使用Apache Kafka将数据从mongoDB传递到spark?或者我应该尝试像Apache风暴这样的其他框架吗?
我对所有这些对我来说都是新的技术有点迷失。您将使用哪些框架来实现此分析器?