OpenNLP Extract Grammar

时间:2012-04-19 04:26:05

标签: java nlp grammar opennlp

我目前正在查看opennlp源代码,试图找到/理解他们用于分块的语法。这不是最简单的任务之一。我开始浏览chunkermodel和相关课程,但没有走得太远..

有没有人搜索过这个?如果有任何建议或想法会让我走上正轨?

1 个答案:

答案 0 :(得分:1)

实际上,与Apache OpenNLP捆绑在一起的算法基于机器学习技术,采用统计方法。模型中没有语法,但是从训练数据中提取参数。

要了解有关算法的更多信息,我建议使用Jurafsky&马丁的书“语音和语言处理”,第6.7节。

你也可以参考Ratnaparkhi的论文:Maximun Entropy Models for Natural Language Ambiguity Resolution

对于Perceptron HMM,迈克尔柯林斯论文:Discriminative training methods for hidden Markov models: theory and experiments with perceptron algorithms

如果您正在寻找的是语法方法,请尝试使用Contraint语法形式。 VISL website列出了一些出版物。