我正在尝试使用VerbNet提供的用于直接处理数据的文件将VerbNet与WordNet链接:
VerbNet => http://verbs.colorado.edu/verb-index/vn/verbnet-3.3.tar.gz
WordNet => http://wordnet-rdf.princeton.edu/static/wordnet.nt.gz
VerbNet中的动词通过它们的sense_key链接到WordNet:
例如直播%2:31:00 ::
这就是sense_key的结构:
(引理)%(语音词数):(词法文件号):(词法词典ID)::
解析nt文件的三重,我发现除lexicographer_id外的所有数据:
lemma => live
part_of_speech_number => 2
lexical_file_number => 31
lexicographer_id => ??
答案 0 :(得分:0)
解析wordnet.nt文件似乎无法为您提供此信息。
如果从http://wordnetcode.princeton.edu/wn3.1.dict.tar.gz下载了Wordnet 3.1数据库(https://wordnet.princeton.edu/download/current-version中的链接),则将在其中找到文件“ index.sense”,其中包含以下条目:
bethel%1:06:00:: 02836245 1 0
bethink%2:31:00:: 00685046 2 1
bethink%2:39:00:: 02171205 1 3
bethlehem%1:15:00:: 08813084 2 0
此结构的当前描述在https://wordnet.princeton.edu/documentation/senseidx5wn
上该行中的第一个参数是VerbNet中使用的sense_key。第二个参数是synset_offset,它与文件wordnet.nt中的Synset标识符一致。
从文件“ index.sense”中,您还可以获取与结构“ word.pos.sense_number”相匹配的意义编号,例如:“ man.n.02”