使用阿拉伯语WordNet在python中使用同义词?

时间:2016-01-05 20:27:28

标签: python nlp arabic

我想在句子中找到阿拉伯语单词的同义词

如果这个单词是英文的,那就完美了,结果用阿拉伯语显示,我想知道是否有可能立即得到一个阿拉伯语单词的同义词而不用英文写成。

我尝试了但是它不起作用&我更喜欢没有tashkeelانتظار而不是انتظار

from nltk.corpus import wordnet as omw
jan = omw.synsets('انتظار ')[0]
print(jan)
print(jan.lemma_names(lang='arb'))

1 个答案:

答案 0 :(得分:1)

nltk中使用的Wordnet不支持阿拉伯语。如果您正在寻找Arabic Wordnet,那么这是完全不同的事情。

对于阿拉伯语wordnet,请下载:

你用:

运行它
$ python AWNDatabaseManagement.py -i upc_db.xml

现在得到像wn.synset('إنتظار')这样的东西。阿拉伯语Wordnet有一个函数wn.get_synsets_from_word(word),但它给出了偏移量。它也只接受在数据库中发声的单词。例如,您应该جَمِيل使用جميل

>> wn.get_synsets_from_word(u"جَمِيل")
[(u'a', u'300218842')]

300218842是جميل的synset的偏移量。

我检查了إنتظار这个词,似乎它在AWN中不存在。

有关使用AWN获取同义词here的详细信息。