如何避免NLP中的顺序处理?

时间:2012-10-10 23:18:36

标签: nlp

NLP中的一般方法是一系列过程:

  1. 令牌化
  2. 形态分析
  3. POS-tagging
  4. 句法分析,或命名实体识别,或名词短语分块等。
  5. 分类(或程序的任何“最终目标”)
  6. 我总是觉得奇怪,每一步都在没有“咨询”后续步骤的情况下做出决定。例如,你可以将一个单词POS标记为名词,即使它使得任何句法分析都无法进一步处理。

    我想知道是否有一些解决后续步骤的一般NLP问题的方法。一种信仰传播,如果你愿意的话。

2 个答案:

答案 0 :(得分:1)

你可能想看看Hollingshead和Roark的“Pipeline Iteration”(http://acl.ldc.upenn.edu/P/P07/P07-1120.pdf),以及Kristy Hollingshead随后在管道上的工作管道阶段之间的沟通。

答案 1 :(得分:0)

您描述的管道通常是多少个应用程序的结构,但它不是唯一可能的架构。一些方法涉及多次通过管道,其中一个阶段的信息在下一个阶段使用。其他工作结合了您列出的一些步骤,例如形态分析和PoS标记。我最近读了一篇名为"用于联合POS和形态感应的分层Dirichlet过程模型的论文"其中PoS标签和形态一起被诱导,因为它们是共同依赖的。