tidytext R西班牙语 - 任何替代方案?

时间:2017-11-02 12:21:27

标签: r sentiment-analysis tidytext

我正在通过Twitter进行情绪分析,但我的推文是西班牙语,因此我无法使用tidytext对这些词进行分类。有谁知道西班牙语是否有类似的包裹?

3 个答案:

答案 0 :(得分:3)

不幸的是,目前非英语语言中的情感词典没有很多很好的开源选项。您可以向作者索取其他语言的NRC lexicon;它由谷歌翻译翻译(当然这增加了不确定性,但总体来说已经证明是可以的)并且作者说他们将其用于研究目的,但会收取商业用途。

答案 1 :(得分:2)

我遇到了与非英语文本化相同的问题。我发现udpipe是由Bnosac开发的r包。它是一个自然语言处理工具包,提供与语言无关的“标记化”,“词性标注”,“词形还原”,“形态特征标记”和原始文本的“依赖性解析”。请注意包中没有情绪标签。那些你需要在其他地方找到的人。

它支持各种非英语语言。

您可以在blogudpipe

的网页上的github了解更多信息。

P.S。我与他们没有任何关系。

答案 2 :(得分:0)

Stanford Core NLP软件包已面市,并通过get_sentiment函数提供了西班牙语的情感