使用自定义词典和同义词集数据库进行情感分析的建议:RuSentiLex和RuWordNet

时间:2019-04-30 18:55:25

标签: python-3.x sentiment-analysis

我正在尝试用俄语进行基于词典的情感分析。

我发现了俄语情感词典RuSentiLex和同义词集数据库RuWordNet。 但是,我缺乏将它们一起使用的经验。

澄清一下,我拥有编码知识,可以预处理文本,并使用RuSentiLex词典进行非常基本的情感分析。

但是,我想加入RuWordNet。我不确定该怎么做,因为我不完全了解POS标记,这是我相信RuWordNet(例如等效的英语WordNet)的目的。

因此,本质上,我有两个问题:

(1)您是否对如何同时使用RuSentilex和RuWordNet有任何建议或指导?

(2)如果RuWordNet是用于POS标记的数据库(如WordNet),是否有任何技巧,指南或使用/编码自定义POS标记器(如RuWordNet)的方法?

我在这个问题上做了一些搜索,但是发现分散的指导。例如,我发现创建自定义NLTK corpus的讨论,而我发现了GitHub page用于“生成和管理RuWordNet thesauri数据库”。

但是即使我生成数据库,也不确定如何将其用于POS标记。

我觉得自己已经摆在眼前,但我缺乏将它们整合在一起的知识。

非常感谢您的帮助或指导。

0 个答案:

没有答案