西班牙语与斯坦福coreNLP的情感分析

时间:2015-04-27 10:11:19

标签: stanford-nlp sentiment-analysis

我是新来的,想知道是否有人可以帮我解决以下问题。

我正在用西班牙语和使用Stanford CoreNLP对文本进行情绪分析,但我无法得到积极的结果。

也就是说,如果我分析任何英文文本分析,最好将其用西班牙文写成,但结果总是否定的

我一直在寻找如何用西班牙语配置解析器,标记化,我发现的所有内容都无法用于情感分析。

有人可以告诉我,唯一有效的是令牌和情绪不是西班牙语吗?

这是我的属性文件,因此我设法找到:

annotators = tokenize,ssplit,pos,ner,parse,sentiment

tokenize.language = zh

pos.model = edu / stanford / nlp / models / pos-tagger / english / spanish-distsim.tagger

ner.model = edu / stanford / nlp / models / ner / spanish.ancora.distsim.s512.crf.ser.gz ner.applyNumericClassifiers = false ner.useSUTime = false

parse.model = edu / stanford / nlp / models / lexparser / spanishPCFG.ser.gz

执行情绪分析的代码是您可以在任何教程中找到的典型代码

非常感谢!!

1 个答案:

答案 0 :(得分:0)

不幸的是,西班牙没有斯坦福情绪模型。目前,所有西班牙语单词都可能被情绪分析算法视为通用的“未知单词”,这就是为什么你会看到一直表现糟糕的原因。

您当然可以训练自己的模型(我相信在互联网上的其他地方记录,但我相信......),但您需要获得西班牙语培训数据才能实现这一目标。