如何从一组单词中自动识别上位词?

时间:2017-07-06 06:47:13

标签: python r nlp semantic-analysis hypernym

例如,我有几组单词 A组:苹果,梨,香蕉,水果,葡萄,西瓜; B组:猫,动物,狗,猪,猴,鸭; 在C组:意大利,澳大利亚,国家,中国,希腊。

如何自动识别这三组的上位词(例如,A组的水果,B组的动物和C组的国家)?非常感谢你。

1 个答案:

答案 0 :(得分:1)

您可以使用内置于nltk的WordNet。有关详细信息,请在此处查看此问题:Determining Hypernym or Hyponym using wordnet nltk

然而,重要的是要理解上位词的识别只会与训练数据允许的一样好。除了使用标记数据进行训练之外,没有神奇的系统可以识别类似对象的分组。