在我的实验中,我使用的是WordNet18数据,其中包含三元组的形式(主语,谓词,对象),一些例子如下:
03964744 _hyponym 04371774 00260881 _hypernym 00260622 02199712 _member_holonym 02188065
我想知道实体ID,例如03964744,代表什么。有人知道如何解码实体吗?
提前谢谢你。
答案 0 :(得分:1)
您看到的8位数字可能数据文件中条目的字节偏移量。见http://wordnet.princeton.edu/wordnet/man/wnintro.5WN.html
经过相当多的搜索后,我认为你正在查看WordNet 3.0的数量(给定synset的字节偏移量在不同版本之间有所不同; 3.1是最新版本)。
你的第一个条目似乎是说摇摆是一种玩具:
http://compling.hss.ntu.edu.sg/omw/cgi-bin/wn-gridx.cgi?synset=03964744-n