NLP POS树的理解

时间:2015-11-06 16:25:12

标签: nlp

如何在NLP中形成树 - >词性标注。这背后的算法是什么? (S    (NP爱丽丝)    (VP       (V追逐)       (NP          (Det)          (N兔子))))

例如Det"""和N"兔子"成为NP(归入NP?) 什么是树形成和节点聚合背后的算法

1 个答案:

答案 0 :(得分:4)

这里你的意思基本上是解析而不是POS标记。 POS只关心为一个单词分配正确的POS标签(即,对于'或者#N;或者#33;狗')。

在解析中,此信息用于解析句子。有依赖解析器和选区解析器。通常为组成树木绘制漂亮的树木。为了解析一个句子,你需要一个语法。 语法由一组说明如何构建成分的规则组成。这是一个非常简单的语法的例子:

S -> NP VP
NP -> DT NN
VP -> V

这个语法会成功解析简单的句子

'the dog barks'

(S (NP (DT the) (NN dog)) (VP (V barks))))

有很多不同的解析算法。 最简单的算法之一是shift-reduce算法。 然后有更复杂的算法,如CYK解析器,LL / LR解析器。此外,还有自下而上和自上而下的解析。我想这是最好的,如果你在这里做一些基本的阅读。 在这里你会发现不同的算法 https://en.m.wikipedia.org/wiki/Category:Parsing_algorithms

解析的一个很好的介绍: http://dickgrune.com/Books/PTAPG_2nd_Edition/