如何消除Conceptnet中的单词歧义

时间:2014-08-22 14:54:21

标签: nlp wordnet word-sense-disambiguation conceptnet

Conceptnet包含两种基本类型的节点,单词(例如/ c / en / cat)和感官(例如/ c / en / cat / n / domestic_cat)。不幸的是,绝大多数边缘使用字节点。这使得推断变得困难,因为我不能确定单词到单词边缘指的是哪种意义。

例如,Conceptnet包含9个使用单词" cat"的感官,大多数是专有名词(/ c / en / cat / n / musical,/ c / en / cat / n / magazine, / c / en / cat / n / a_spiteful_woman_gossip等)。如果边缘说" / c / en / cat / r / HasA / c / en / tail",我知道通过使用我自己的经验,这可能是指/ c / en / cat / n / domestic_cat,没有其​​他感官。然而,如果我看到" / c / en / cat / r / IsA / c / en / fun_to_watch"的边缘,我知道它可能指的是/ c / en / cat / n / music,但它仍然可能指的是/ c / en / cat / n / domestic_cat。

如何自动执行此过程?如何翻译仅使用单词节点的边缘,以便它们使用感知节点?

1 个答案:

答案 0 :(得分:1)

ConceptNet似乎没有包含任何词义消歧,请参阅FAQ

  

ConceptNet只做了最低限度的区分词义   远 - 在ConceptNet 5.5的构建图中,字义是唯一的   以他们的词性(类似于sense2vec)来区分。共发现   对于每个单词都有很多感官,尽管其中有些是   在实践中难以区分。