如何训练Stanford CoreNLP获取其他语言的信息?

时间:2014-04-16 01:56:16

标签: java stanford-nlp sentiment-analysis

我正在使用CoreNLP来计算给定文本的情绪。我已经成功地执行了英语。我需要为印地语等其他语言做同样的事情。我可以知道如何训练系统并将其用于其他语言吗?以下是英语代码:

Properties props = new Properties();
props.setProperty("annotators", "tokenize, ssplit, parse, sentiment");
StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
String text = "I love the display of iPhone but hate its battery life";
Annotation annotation = pipeline.process(text);
for (CoreMap sentence : annotation.get(CoreAnnotations.SentencesAnnotation.class)) {
   Tree tree = sentence.get(SentimentCoreAnnotations.AnnotatedTree.class);
   int sentiment = RNNCoreAnnotations.getPredictedClass(tree);
   System.out.println(sentiment);
}                

1 个答案:

答案 0 :(得分:2)

有关培训的信息Stanford NLP RNTN由mbatchkarov提供。

一般来说,非英语情感分析仍然是一项正在进行中的工作,许多方法 - 尤其是那些超出词汇量的方法 - 可能需要经过重新考虑才能适用于另一种语言。例如,像土耳其语或德语这样的凝聚语言(即将大量词汇压缩成一个大词的语言)甚至不会在许多文本挖掘和情感分析任务中表现出色。

尝试谷歌搜索印地文的情绪分析。我发现的一篇有趣的论文是Mittal, et al