我目前正致力于资本市场建模。我存储来自各种数据源的数据,即使用Impala的财经新闻。
我已使用Impala将此数据存储在articleID,ArticleDATA
形式的表中。
我的下一步是在所有记录上逐行进行语义分析。
我一直在阅读这些资源
Executing and testing stanford core nlp example
http://nlp.stanford.edu/software/corenlp.shtml
http://nlp.stanford.edu/sentiment/code.html
我正在使用Java在Eclipse中创建Map / Reduce工作,并且无法弄清楚如何使用JAR来帮助我进行分析。
P.S:我跑了命令
java -cp "*" -mx1g edu.stanford.nlp.sentiment.SentimentPipeline -file input.txt
关于样本数据,它通过命令行工作。我想知道如何在eclipse,map / reduce中做到这一点。
目前的产出情绪是正面,中性,负面,但我需要它为1,0,-1。我想这很容易理解,所以不是优先考虑的事情。!
我很困惑如何去做。
由于
答案 0 :(得分:0)
好吧,我想通了..所以关闭这个问题。不得不使用JAR中的Sentiment文件。试验和错误。然后做了一个MApReduce工作。