WordNet感官在ID中编码有关该感官的一些信息。基于lemma_from_key
方法here,我们可以看到前三个数字是 pos_number , lexname_index 和 lex_id 。另外两个是什么?是否有关于这些含义(更具体而言)的文档?
答案 0 :(得分:2)
ss_type:lex_filenum:lex_id:head_word:head_id
lemma是单词或并置词的ASCII文本,如 与pos对应的WordNet数据库索引文件。引理较低 情况,并置是通过将单个单词与 下划线(_)。
ss_type是一位十进制整数,表示同义词集类型 在某种意义上。请参阅下面的“同义词集类型”以获取数字列表 对应于每种同义词集类型。
lex_filenum是两位十进制整数,表示名称 包含该意义的同义词集的词典编辑器文件。看到 lexnames(5WN)用于词典编辑器文件名及其列表 相应的数字。
lex_id是两位十进制整数,将其附加到引理后, 在词典编辑器文件中唯一标识一种意义。 lex_id 数字通常以00开头,并以附加方式递增 单词的感觉被添加到同一文件中,尽管没有 要求数字必须连续或以00开头。注意 默认值为00,因此不存在 词典编辑器文件。仅非默认lex_id值必须显式 在词典编辑器文件中分配。有关信息,请参见wninput(5WN) 词典编辑器文件的格式。
head_word仅在意义在形容词卫星中时存在 同义词集。这是人造卫星首字的引理 同义词集。
head_id是两位十进制整数,附加到 head_word,唯一标识一个单词中head_word的含义 lexicographer文件,如lex_id所述。这有一个价值 仅当存在head_word时,才可以输入该字段。