NLTK正则表达式模式中的<nn> *和<nn。*> *有什么区别?

时间:2019-03-07 07:34:44

标签: python python-3.x nlp nltk

我遍历了NLTK书中的chapter 7,以寻求解决方案,但到目前为止我还不清楚。

  1. <NN>*表示0个或多个名词
  2. 如书中所述,
  3. <NN.*>*表示 0个或多个任何类型的名词

在NLTK中,NNNNSNNPNNPS是否彼此排斥? (我认为NN是其余的保护伞可能是错误的)

在这种情况下,<NN.*>*表示NNNNSNNPNNPS中的任意0个或多个,其本身可以重复0或更多次(那个外面的*)?还是只是NN重复了0次或多次,又重复了0次或多次? 还是我完全误会了?

1 个答案:

答案 0 :(得分:1)

Here是Penn树库POS标签的列表。如您所见,NN不包含NNSNNPNNPS;它只代表单数名词和质量名词。

  

NN-奇异或名词名词
  NNS-名词,复数
  NNP-专有名词,单数
  NNPS-专有名词,复数

<NN.*>*表示NNNNSNNPNNPS中的任何一个(从外部*重复0次或更多次),而<NN>*表示仅<NN>重复0次或多次。