我正在寻找一个将“妈妈”,“女性”和“女性”等词组合在一起的方案。一般来说,根据他们的类对单词进行分组。在上面的例子中,类是Person:Female。我正在使用NLTK相似性指标,但它们似乎并不适合我的目的。还有什么我可以看的吗?
答案 0 :(得分:0)
我不确定您是否了解Wordnet项目可能正是您正在寻找的内容。已经进行了大量的研究,实际上有一个全球项目将这个数据库映射到其他语言。词汇分析是合理的,但据我所知,数据存储在一些凌乱的格式中。主要网站位于Princeton Wordnet。另外 - 如果你搜索,你会发现数据库的MSSQL版本 客户端程序,以帮助您评估数据库是否适合您的目的 - 这称为“Wordnet浏览器”。链接here。我进入了妈妈,并且能够让女性,人和母亲脱离高阶相关术语。这里要学习很多词汇术语,我自己也没有深究。 但我希望这对你有所帮助。