在wordnet.princeton.edu上似乎没有改变日志或类似的东西
答案 0 :(得分:3)
要添加到@ abarisone的答案,实际的同义词ID本身在WordNet 3.0和WordNet 3.1之间可能有所不同:(
例如,在WordNet 3.1中,主席为103005231-n。
但是,在WordNet 3.0中,是 103001627-n 。但您无法在http://wordnet-rdf.princeton.edu/wn31/103001627-n或http://wordnet-rdf.princeton.edu/wn30/103001627-n中查找,但您需要使用错误重定向到http://wordnet-rdf.princeton.edu/wn30/03001627-n的102992974-n。
我认为这是WordNet RDF 3.1 online app中的错误,因为102992974-n并未正式存在。你甚至无法搜索它(在线和离线)。如果您在该页面上获得RDF / JSON-LD文件,它会为您提供 103005231-n 。
在wn3.1.dict/dict/index.noun
:
chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700
该文件中没有提到02992974
。
这两个问题都令人困惑。我想知道他们为什么在次要修订中更改了synset ID。
关于WordNet同义词ID的状态:
结论是,目前使用WordNet 3.0的synset ID是最安全的。
对于未来的工作,可以考虑使用Global Wordnet Association的语际指数(即将推出)。其ID将与Wordnet 3.0兼容。
来自wn-users mailing list, 30 Oct 2015的参考资料:
来自:Raphael,Nicholas
URI是从“dblocation”字段构建的,该字段是字节偏移量 从相关的基于字符的数据库文件的开头(我是 不确定哪个)。这将随着项目的不同而在发行版之间发生变化 删除并添加和移动。
来自:Peter Clark
据我所知.......仅供参考,一个鲜为人知的事实是 感知键(例如,“能力%1:07:00 ::”)在发行版之间是稳定的, 除非感官分裂或合并。这提供了一种稳定的方式 引用跨版本的synset,而不是使用synset数字。也 您可以在不同版本中找到synset编号之间的映射 通过寻找相同的感知键。 (sensekey-> synset是多对一的 映射:一个synset可能有多个感知键,每个感应键一个 同义词中的单词+感觉。但是感知键恰好映射到一个synset)。 祝福,皮特
来自:John McCrae
Hello Hendy,
是WordNet synset标识符基于的字节偏移量 在给定版本的WordNet中的描述符,因此它们远非如此 在各种版本的WordNets中保持稳定。感知标识符更多 稳定,但仍然可能是不可靠的,因为感觉会分裂和合并。 此外,有两个略有不同版本的WordNet 3.1和 WordNet RDF版本接受来自......的同义词标识符 当然,正如其他人评论的那样,都非常令人困惑。
出于这个原因,全球WordNet协会已经开始研究 语际指数,我们预计很快就会上线(即及时 对于1月份的全球WordNet会议而言,并将给予每个人 synset一个不变的URI。
Piek Vossen最近对此进行了很好的讨论,这张幻灯片是 在线:http://ldl2014.org/slides/Vossen-LOD-CILI.pdf
目前,我建议使用WN 3.0标识符进行链接 同义词,WordNet语际索引也将基于。
问候,约翰
答案 1 :(得分:0)
如果您查看WordNet's Current Version section,您会发现:
WordNet的最新Windows版本是2.1,于3月份发布 2005.版本3.0 for Unix / Linux / Solaris / etc.发布于2006年12月。版本3.1目前仅在线提供。
此外,谈论版本3.0和3.1之间的区别,你可以阅读:
仅限WordNet 3.1数据库文件
您可以从此处下载WordNet 3.1数据库文件。注意 这不是上面的完整包,也不包含任何包 用于运行WordNet的代码。但是,您可以替换中的文件 使用这些文件和3.0本地安装的数据库目录 将运行WordNet接口,从3.1返回条目 数据库。这只是WordNet 3.1的压缩tar文件 数据库文件。
不同之处在于WordNet 3.1仅在线,但您可以替换3.0版本数据库并使用本地安装。
您可以找到有关版本3.0 here的文档。