如何使用StanfordCoreNLP jar在Java Map / Reduce Job中进行语义分析?

时间:2014-04-23 04:41:25

标签: java eclipse mapreduce stanford-nlp sentiment-analysis

我目前正致力于资本市场建模。我存储来自各种数据源的数据,即使用Impala的财经新闻。

我已使用Impala将此数据存储在articleID,ArticleDATA形式的表中。

我的下一步是在所有记录上逐行进行语义分析。

我一直在阅读这些资源

Executing and testing stanford core nlp example

http://nlp.stanford.edu/software/corenlp.shtml

https://www.openshift.com/blogs/day-20-stanford-corenlp-performing-sentiment-analysis-of-twitter-using-java

http://nlp.stanford.edu/sentiment/code.html

我正在使用Java在Eclipse中创建Map / Reduce工作,并且无法弄清楚如何使用JAR来帮助我进行分析。

P.S:我跑了命令  java -cp "*" -mx1g edu.stanford.nlp.sentiment.SentimentPipeline -file input.txt 关于样本数据,它通过命令行工作。我想知道如何在eclipse,map / reduce中做到这一点。

目前的产出情绪是正面,中性,负面,但我需要它为1,0,-1。我想这很容易理解,所以不是优先考虑的事情。!

我很困惑如何去做。

由于

1 个答案:

答案 0 :(得分:0)

好吧,我想通了..所以关闭这个问题。不得不使用JAR中的Sentiment文件。试验和错误。然后做了一个MApReduce工作。