应用错误收集

如何避免NLP中的顺序处理？

时间：2012-10-10 23:18:36

标签： nlp

NLP中的一般方法是一系列过程：

令牌化
形态分析
POS-tagging
句法分析，或命名实体识别，或名词短语分块等。
分类（或程序的任何“最终目标”）

我总是觉得奇怪，每一步都在没有“咨询”后续步骤的情况下做出决定。例如，你可以将一个单词POS标记为名词，即使它使得任何句法分析都无法进一步处理。

我想知道是否有一些解决后续步骤的一般NLP问题的方法。一种信仰传播，如果你愿意的话。

2 个答案:

答案 0 :(得分：1)

你可能想看看Hollingshead和Roark的“Pipeline Iteration”（http://acl.ldc.upenn.edu/P/P07/P07-1120.pdf），以及Kristy Hollingshead随后在管道上的工作管道阶段之间的沟通。

答案 1 :(得分：0)

您描述的管道通常是多少个应用程序的结构，但它不是唯一可能的架构。一些方法涉及多次通过管道，其中一个阶段的信息在下一个阶段使用。其他工作结合了您列出的一些步骤，例如形态分析和PoS标记。我最近读了一篇名为＆＃34;用于联合POS和形态感应的分层Dirichlet过程模型的论文＆＃34;其中PoS标签和形态一起被诱导，因为它们是共同依赖的。