我目前正在查看opennlp源代码,试图找到/理解他们用于分块的语法。这不是最简单的任务之一。我开始浏览chunkermodel和相关课程,但没有走得太远..
有没有人搜索过这个?如果有任何建议或想法会让我走上正轨?
答案 0 :(得分:1)
实际上,与Apache OpenNLP捆绑在一起的算法基于机器学习技术,采用统计方法。模型中没有语法,但是从训练数据中提取参数。
要了解有关算法的更多信息,我建议使用Jurafsky&马丁的书“语音和语言处理”,第6.7节。
你也可以参考Ratnaparkhi的论文:Maximun Entropy Models for Natural Language Ambiguity Resolution
对于Perceptron HMM,迈克尔柯林斯论文:Discriminative training methods for hidden Markov models: theory and experiments with perceptron algorithms
如果您正在寻找的是语法方法,请尝试使用Contraint语法形式。 VISL website列出了一些出版物。