Stanford Parser - POS标记 - 代名词?

时间:2016-09-15 15:17:01

标签: stanford-nlp pos-tagger

我注意到Stanford Parser标记了#34;任何人"和"任何人"作为名词,而它们是代词;我试图设置"任何人"在不同的情况下,我得到了相同的结果。任何人都能告诉我它是否与他/她有关并且是否有办法纠正它(我的意思是或许有些设置?)。

谢谢!

1 个答案:

答案 0 :(得分:0)

这是一个语言学问题,而不是代码问题。对这些词的分析很复杂。许多语言学家会将它们描述为融合的限定词和名词,因为它们至少在历史上是相当透明的。

一般来说,我们目前使用Penn Treebank标准来进行英语的标记化,词性和短语标签。 Penn Treebank将这些单词注释为名词(NN) - 正确或错误 - 这就是我们的工具目前所做的。

但是,您可能很高兴知道根据Universal Dependencies指南,这些词确实是代词(PRON)。我们肯定会在未来版本中更多地使用Universal Dependencies。