WordNet是如何形成的

时间:2011-10-13 10:01:39

标签: wordnet nlp

我想知道如何检索WordNet之间的层次关系。

是手动完成还是通过计算机技术。

如果基于计算机技术,它们是什么?

1 个答案:

答案 0 :(得分:5)

来自常见问题:

  

q.1.2你在哪里获得WordNet的定义? (简答)我们的   词典编纂者写下它们。

     

您在哪里获得WordNet的定义? (答案很长)来自   WordNet前言:电子词汇数据库,第xviii-xix页:

     

人们有时会问,“你从哪里得到你的话?”我们始于1985年   用Kučera和弗朗西斯的今日标准语料库中的话来说   主要是编辑英语(熟悉的布朗语料库)   因为它们为不同的词性提供了频率。   当HenryKučera警告我们时,我们很好地进入了这个名单,   虽然他和弗朗西斯拥有布朗语料库,但语法标签   数据已经出售给Houghton Mifflin。因此我们放弃了计划   使用他们的频率计数(1988年Richard Beckwith开发了一个   我们使用的多义词索引)。我们还整合了所有   Charles Osgood用来形成语义的形容词对   微分。因为同义词对我们来说至关重要,所以我们   在各种语言中查找单词:例如,Laurence Urdang的   小“同义词和反义词的基本书”(1978),Urdang的修订版   罗德尔的“同义词查找者”(1978)和罗伯特查普曼的第四次   版“罗杰的国际词库”(1977) - 在这样的作品中,   一句话很快就会导致其他人。 1986年末我们收到了一份清单   Fred Chang在海军人事研究中编写的词汇   开发中心,我们与自己的清单进行比较;我们曾经   沮丧地发现只有15%的重叠。

     

所以Chang的名单成了输入。并在1993年我们获得了清单   Ralph Grishman及其同事在纽约的39,143个字   大学包括在他们的共同词典COMLEX;这次我们是   令人沮丧的是,WordNet只包含74%的COMLEX字样。但那   列表也成了输入。总之,各种来源都有   贡献;我们在建立词汇方面没有很好的纪律。   事实是英语词汇非常大,我们很幸运   我们的赞助商对我们很耐心,因为我们慢慢爬上了   山