我正在尝试用俄语进行基于词典的情感分析。
我发现了俄语情感词典RuSentiLex和同义词集数据库RuWordNet。 但是,我缺乏将它们一起使用的经验。
澄清一下,我拥有编码知识,可以预处理文本,并使用RuSentiLex词典进行非常基本的情感分析。
但是,我想加入RuWordNet。我不确定该怎么做,因为我不完全了解POS标记,这是我相信RuWordNet(例如等效的英语WordNet)的目的。
因此,本质上,我有两个问题:
(1)您是否对如何同时使用RuSentilex和RuWordNet有任何建议或指导?
(2)如果RuWordNet是用于POS标记的数据库(如WordNet),是否有任何技巧,指南或使用/编码自定义POS标记器(如RuWordNet)的方法?
我在这个问题上做了一些搜索,但是发现分散的指导。例如,我发现创建自定义NLTK corpus的讨论,而我发现了GitHub page用于“生成和管理RuWordNet thesauri数据库”。
但是即使我生成数据库,也不确定如何将其用于POS标记。
我觉得自己已经摆在眼前,但我缺乏将它们整合在一起的知识。
非常感谢您的帮助或指导。