通过python代码阅读语料库,用于阿拉伯语

时间:2011-06-02 19:44:10

标签: python nltk

我想阅读阿拉伯语词典Bw,然后通过Python提取一些词汇项目,如“N”,“V”。此外,我有阿拉伯笔树库我想从中提取trigram。我是使用Python的新手,我从哪里开始?

1 个答案:

答案 0 :(得分:0)

只有一个地方可以开始。

http://www.nltk.org/

Python是自然语言处理中使用最多的工具,构建和使用NLTK的学术团体可能已经开发出了一种能够满足您所需要的大部分工具。

最好从这个教程http://www.desilinguist.org/pdf/crossroads.pdf开始,并使用简单的欧洲语言。然后,当您更熟悉这些工具时,请开始使用阿拉伯语文本。