如何在NLP中形成树 - >词性标注。这背后的算法是什么? (S (NP爱丽丝) (VP (V追逐) (NP (Det) (N兔子))))
例如Det"""和N"兔子"成为NP(归入NP?) 什么是树形成和节点聚合背后的算法
答案 0 :(得分:4)
这里你的意思基本上是解析而不是POS标记。 POS只关心为一个单词分配正确的POS标签(即,对于'或者#N;或者#33;狗')。
在解析中,此信息用于解析句子。有依赖解析器和选区解析器。通常为组成树木绘制漂亮的树木。为了解析一个句子,你需要一个语法。 语法由一组说明如何构建成分的规则组成。这是一个非常简单的语法的例子:
S -> NP VP
NP -> DT NN
VP -> V
这个语法会成功解析简单的句子
'the dog barks'
到
(S (NP (DT the) (NN dog)) (VP (V barks))))
有很多不同的解析算法。 最简单的算法之一是shift-reduce算法。 然后有更复杂的算法,如CYK解析器,LL / LR解析器。此外,还有自下而上和自上而下的解析。我想这是最好的,如果你在这里做一些基本的阅读。 在这里你会发现不同的算法 https://en.m.wikipedia.org/wiki/Category:Parsing_algorithms
解析的一个很好的介绍: http://dickgrune.com/Books/PTAPG_2nd_Edition/