从wordnet中选择适当的单词意义

时间:2015-08-12 08:17:38

标签: nlp ontology wordnet word-sense-disambiguation

我正在使用Wordnet查找本体概念的同义词。我怎样才能为我的本体论概念选择合适的意义。例如,有一个ontlogy概念"会议"它在wordnet中有以下同义词 名词会议有3种感官(前3种来自标记文本)

  1. (12)会议 - (预先安排的会议,用于咨询或交换信息或讨论(尤指具有正式议程的会议))
  2. (2)联赛,会议 - (为其成员组织比赛的运动队协会)
  3. (2)会议,小组讨论 - (有同意(严肃)主题的参与者之间的讨论) 现在,第一和第三个同义词对我的本体概念有着重要的意义。我如何才能从wordnet中选择这两个?

3 个答案:

答案 0 :(得分:5)

您正在寻找的技术是语义消歧/表示的方向。

最“传统的方法”是 Word Sense Disambiguation (WSD),看看

然后是下一代 Word Sense感应/主题建模/知识表示

然后是最近的炒作:

  • Word嵌入,向量空间模型,神经网络

有时人们跳过语义表达并直接进行文本相似性,并通过比较句子对,差异/相似性,然后才能达到文本处理的最终目的。

查看Normalize ranking score with weights以获取与STS相关的工作列表。

另一方面,有

最近还有一项关于本体归纳/扩展的任务:

根据最终任务的不同,上述任何一种技术都可能有所帮助。

答案 1 :(得分:0)

您也可以尝试Babelfy,它提供Word Sense消歧和命名实体消歧。

演示: http://babelfy.org/

API: http://babelfy.org/guide

答案 2 :(得分:0)

看一下这个清单:100 Best GitHub: Word-sense Disambiguation 并通过WordNet进行搜索 - 有几个合适的库。

我没有使用它们中的任何一个,但是this one似乎很有希望,因为它基于经典但有效的想法(即Lesk algorithm),通过现代的词嵌入方法进行升级。实际上,在找到它之前,我建议尝试几乎相同的想法。

另请注意,所有方法都试图找到与当前单词/搭配的上下文最相似的含义(在您的情况下为WordNet sysnet),因此将您尝试的单词的上下文设置为至关重要歧义。例如,单词可以来自某些文本,大多数库依赖于它。