WordNet意义上的每个数字是什么意思?

时间:2019-07-11 15:06:54

标签: nlp wordnet

WordNet感官在ID中编码有关该感官的一些信息。基于lemma_from_key方法here,我们可以看到前三个数字是 pos_number lexname_index lex_id 。另外两个是什么?是否有关于这些含义(更具体而言)的文档?

1 个答案:

答案 0 :(得分:2)

ss_type:lex_filenum:lex_id:head_word:head_id
  

lemma是单词或并置词的ASCII文本,如   与pos对应的WordNet数据库索引文件。引理较低   情况,并置是通过将单个单词与   下划线(_)。

     

ss_type是一位十进制整数,表示同义词集类型   在某种意义上。请参阅下面的“同义词集类型”以获取数字列表   对应于每种同义词集类型。

     

lex_filenum是两位十进制整数,表示名称   包含该意义的同义词集的词典编辑器文件。看到   lexnames(5WN)用于词典编辑器文件名及其列表   相应的数字。

     

lex_id是两位十进制整数,将其附加到引理后,   在词典编辑器文件中唯一标识一种意义。 lex_id   数字通常以00开头,并以附加方式递增   单词的感觉被添加到同一文件中,尽管没有   要求数字必须连续或以00开头。注意   默认值为00,因此不存在   词典编辑器文件。仅非默认lex_id值必须显式   在词典编辑器文件中分配。有关信息,请参见wninput(5WN)   词典编辑器文件的格式。

     

head_word仅在意义在形容词卫星中时存在   同义词集。这是人造卫星首字的引理   同义词集。

     

head_id是两位十进制整数,附加到   head_word,唯一标识一个单词中head_word的含义   lexicographer文件,如lex_id所述。这有一个价值   仅当存在head_word时,才可以输入该字段。

发件人:https://wordnet.princeton.edu/documentation/senseidx5wn