Syntaxnet POS tagger使用大写

时间:2017-10-24 14:56:57

标签: nlp named-entity-recognition syntaxnet part-of-speech parsey-mcparseface

我想使用Syntaxnet来获取推文的POS标签(更具体地说,从文本中提取命名实体)。但是,Parsey McParseface默认情况下区分大小写。由于推文通常不使用大小写,我考虑使用无大小写标记。我在代码中发现了大写的一些内容,但我不确定是否以及如何使用它:

https://github.com/dsindex/syntaxnet/blob/15831789a706cbc482efeeec635a8f0315d0b3fb/English/context.pbtxt

让我举个更清楚的例子。考虑例句John gave the money to Mariajohn gave the money to maria(有案例和无案例):

有上限:

gave VBD ROOT
 +-- John NNP nsubj
 +-- money NN dobj
 |   +-- the DT det
 +-- to IN prep
     +-- Maria NNP pobj

没有上限:

gave VBD ROOT
 +-- john NNP nsubj
 +-- money NN dobj
 |   +-- the DT det
 +-- to TO prep
     +-- maria NN pobj

如你所见,玛丽亚是NNP,而玛丽亚(没有帽子)是NN。在提取命名实体时,如果一个单词被标记为NN或NNP,则会有所不同。

有没有办法改善这个?是不是没有用于语法网的Parsey McParseface?

0 个答案:

没有答案