WordNet 3.1和WordNet 3.0之间的区别是什么?

时间:2015-09-06 12:06:19

标签: nlp wordnet

在wordnet.princeton.edu上似乎没有改变日志或类似的东西

2 个答案:

答案 0 :(得分:3)

要添加到@ abarisone的答案,实际的同义词ID本身在WordNet 3.0和WordNet 3.1之间可能有所不同:(

例如,在WordNet 3.1中,主席103005231-n

但是,在WordNet 3.0中, 103001627-n 。但您无法在http://wordnet-rdf.princeton.edu/wn31/103001627-nhttp://wordnet-rdf.princeton.edu/wn30/103001627-n中查找,但您需要使用错误重定向到http://wordnet-rdf.princeton.edu/wn30/03001627-n102992974-n

我认为这是WordNet RDF 3.1 online app中的错误,因为102992974-n并未正式存在。你甚至无法搜索它(在线和离线)。如果您在该页面上获得RDF / JSON-LD文件,它会为您提供 103005231-n

wn3.1.dict/dict/index.noun

chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700  

该文件中没有提到02992974

这两个问题都令人困惑。我想知道他们为什么在次要修订中更改了synset ID。

关于WordNet同义词ID的状态:

结论是,目前使用WordNet 3.0的synset ID是最安全的。

对于未来的工作,可以考虑使用Global Wordnet Association的语际指数(即将推出)。其ID将与Wordnet 3.0兼容。

来自wn-users mailing list, 30 Oct 2015的参考资料:

  

来自:Raphael,Nicholas

     

URI是从“dblocation”字段构建的,该字段是字节偏移量   从相关的基于字符的数据库文件的开头(我是   不确定哪个)。这将随着项目的不同而在发行版之间发生变化   删除并添加和移动。

  

来自:Peter Clark

     

据我所知.......仅供参考,一个鲜为人知的事实是   感知键(例如,“能力%1:07:00 ::”)在发行版之间是稳定的,   除非感官分裂或合并。这提供了一种稳定的方式   引用跨版本的synset,而不是使用synset数字。也   您可以在不同版本中找到synset编号之间的映射   通过寻找相同的感知键。 (sensekey-> synset是多对一的   映射:一个synset可能有多个感知键,每个感应键一个   同义词中的单词+感觉。但是感知键恰好映射到一个synset)。   祝福,皮特

  

来自:John McCrae

     

Hello Hendy,

     

是WordNet synset标识符基于的字节偏移量   在给定版本的WordNet中的描述符,因此它们远非如此   在各种版本的WordNets中保持稳定。感知标识符更多   稳定,但仍然可能是不可靠的,因为感觉会分裂和合并。   此外,有两个略有不同版本的WordNet 3.1和   WordNet RDF版本接受来自......的同义词标识符   当然,正如其他人评论的那样,都非常令人困惑。

     

出于这个原因,全球WordNet协会已经开始研究   语际指数,我们预计很快就会上线(即及时   对于1月份的全球WordNet会议而言,并将给予每个人   synset一个不变的URI。

     

Piek Vossen最近对此进行了很好的讨论,这张幻灯片是   在线:http://ldl2014.org/slides/Vossen-LOD-CILI.pdf

     

目前,我建议使用WN 3.0标识符进行链接   同义词,WordNet语际索引也将基于。

     

问候,约翰

答案 1 :(得分:0)

如果您查看WordNet's Current Version section,您会发现:

  

WordNet的最新Windows版本是2.1,于3月份发布   2005.版本3.0 for Unix / Linux / Solaris / etc.发布于2006年12月。版本3.1目前仅在线提供。

此外,谈论版本3.0和3.1之间的区别,你可以阅读:

  

仅限WordNet 3.1数据库文件

     

您可以从此处下载WordNet 3.1数据库文件。注意   这不是上面的完整包,也不包含任何包   用于运行WordNet的代码。但是,您可以替换中的文件   使用这些文件和3.0本地安装的数据库目录   将运行WordNet接口,从3.1返回条目   数据库。这只是WordNet 3.1的压缩tar文件   数据库文件。

不同之处在于WordNet 3.1仅在线,但您可以替换3.0版本数据库并使用本地安装。

您可以找到有关版本3.0 here的文档。