荷兰语语法在python的NLTK中

时间:2011-02-14 10:12:50

标签: python parsing nlp nltk context-free-grammar

我正在研究荷兰语语料库,我想知道NLTK是否嵌入了荷兰语语法,以便我可以解析我的句子?一般来说,NLTK只适用于英语吗?我知道它有Alpino荷兰语copora,但没有迹象表明功能(如使用CFG解析)也是为荷兰语制作的。 感谢

2 个答案:

答案 0 :(得分:2)

这是我对NLTK书籍作者之一Steven Bird的邮件的回应:

  

如果您提供语法规则,NLTK可以解析荷兰语。   有关指导,请参阅NLTK书籍:   http://www.nltk.org/book   你或许可以使用Alpino语料库来开发   语法(或训练统计解析器)。如果您的主要兴趣   正在获得荷兰语的解析句子,我建议你尝试   找到一个现有的解析器,而不是开发自己的解析器。

最后,我最终使用了非常强大的Alpino解析器并用Prolog编写,但我设法在python中移植(二进制版本)。

答案 1 :(得分:0)

我没有直截了当的答案,但通过合并来自以下两页的信息,您应该能够找到它。 NLTK Here you can find an overview of the high-level parsing interface。解析器需要一个模型,如果存在,将在页面中列出data packages that ships with nltk的文档。

如您所知,Alpino Dutch Treebank与NLTK一起发货,因此在最糟糕的情况下您应该能够自己学习模型(解析器api还提供学习设施)。

希望它有所帮助。