我是新来的,想知道是否有人可以帮我解决以下问题。
我正在用西班牙语和使用Stanford CoreNLP对文本进行情绪分析,但我无法得到积极的结果。
也就是说,如果我分析任何英文文本分析,最好将其用西班牙文写成,但结果总是否定的
我一直在寻找如何用西班牙语配置解析器,标记化,我发现的所有内容都无法用于情感分析。
有人可以告诉我,唯一有效的是令牌和情绪不是西班牙语吗?
这是我的属性文件,因此我设法找到:
annotators = tokenize,ssplit,pos,ner,parse,sentiment
tokenize.language = zh
pos.model = edu / stanford / nlp / models / pos-tagger / english / spanish-distsim.tagger
ner.model = edu / stanford / nlp / models / ner / spanish.ancora.distsim.s512.crf.ser.gz ner.applyNumericClassifiers = false ner.useSUTime = false
parse.model = edu / stanford / nlp / models / lexparser / spanishPCFG.ser.gz
执行情绪分析的代码是您可以在任何教程中找到的典型代码
非常感谢!!
答案 0 :(得分:0)
不幸的是,西班牙没有斯坦福情绪模型。目前,所有西班牙语单词都可能被情绪分析算法视为通用的“未知单词”,这就是为什么你会看到一直表现糟糕的原因。
您当然可以训练自己的模型(我相信在互联网上的其他地方记录,但我相信......),但您需要获得西班牙语培训数据才能实现这一目标。