我正在尝试为WOLF创建一个界面(Wordnet LibreduFrançais,免费法语Wordnet)。目标是为阿拉伯语Wordnet(http://www.talp.upc.edu/index.php/technology/resources/multilingual-lexicons-and-machine-translation-resources/multilingual-lexicons/72-awn)复制AWNDatabaseManger,但对于WOLF。
我面临的问题是我无法找到WOLF(http://alpage.inria.fr/~sagot/wolf-en.html)或WoNeF(这是另一个法语翻译的Wordnet http://wonef.fr/)的正确数据规范。
对于阿拉伯语Wordnet,他们提供了详细的数据规范,可在http://globalwordnet.org/arabic-wordnet/awn-data-spec/找到 我试图找到相同的WOLF或WoNeF。
否则如何映射这两个文件?
例如,一个单词及其在awn中的关系如下:
<item itemid="$ajarap_AlS~amog_n1AR" offset="111586059" lexfile="" name="شَجَرَة الصَّمْغ " type="synset" headword="" POS="n" source="" gloss="" authorshipid="80" />
<word wordid="$ajarap__1" value="شَجَرَة الصَّمْغ " synsetid="$ajarap_AlS~amog_n1AR" frequency="" corpus="" authorshipid="11461" />
<link type="has_hyponym" link1="$ajarap_AlS~amog_n1AR" link2=">ukAlibotws_n1AR" authorshipid="35038" />
<link type="has_hyponym" link1="$ajarap_n1AR" link2="$ajarap_AlS~amog_n1AR" authorshipid="35041" />
单词defintion(item)和它的关系(link)分隔有不同的属性。
而在WOLF中,一个单词和它的关系看起来像:
<SYNSET>
<ILR type="near_antonym">eng-30-00002098-a</ILR>
<ILR type="be_in_state">eng-30-05200169-n</ILR>
<ILR type="be_in_state">eng-30-05616246-n</ILR>
<ILR type="eng_derivative">eng-30-05200169-n</ILR>
<ILR type="eng_derivative">eng-30-05616246-n</ILR>
<ID>eng-30-00001740-a</ID>
<SYNONYM>
<LITERAL lnote="2/2:fr.csbgen,fr.csen">comptable</LITERAL>
</SYNONYM>
<DEF>(usually followed by `to') having the necessary means or skill or know-how or authority to do something
</DEF>
<USAGE>able to swim</USAGE>
<USAGE>she was able to program her computer</USAGE>
<USAGE>we were at last able to buy a car</USAGE>
<USAGE>able to get a grant for the project</USAGE>
<BCS>3</BCS>
<POS>a</POS>
</SYNSET>
我可以假设awn属性gloss等于狼标签用法,而awn属性pos等于狼标签pos。
但重点是我不想做出假设,我正在寻找适当的文档,我可以确定并完成两个文件之间的映射。
有人可以请我指出正确的文档吗?
答案 0 :(得分:2)
WOLF数据库的格式基于此处定义的VisDic: https://nlp.fi.muni.cz/trac/deb2/wiki/WordNetFormat XSD可在此处获取:http://deb.fi.muni.cz/debvisdic.xsd
答案 1 :(得分:1)
根据您的需要,解决方法可能是使用NLTK Python库,该库集成了一些可能来自WOLF的法语同义词
last xs