我的项目是通过对推文(Cricket)进行情感分析来进行预测。 我将收集推文作为流。 为此,我需要对推文进行实时分析,然后对推文进行情感分析。 我正在使用Kafka和Spark Streaming。
如何使用kafka实时分析推文?我需要与板球有关的那些推文 经过实时分析后,如何使用火花流对推文进行情感分析?
您能告诉我哪种语言最适合完成整个任务,Python还是Java?
答案 0 :(得分:0)
我建议使用python 以流形式收集推文-使用Kafka:https://www.rittmanmead.com/blog/2017/01/getting-started-with-spark-streaming-with-python-and-kafka/
要对推文进行实时分析,您将需要nltk,word2vec或某些自然语言处理api:https://github.com/ankitagarwal/nltk_kafka_twitter
https://github.com/emumba-com/live_twitter_sentiment_analysis
我希望这可以为您的任务提供一个良好的开端。