我想使用Syntaxnet来获取推文的POS标签(更具体地说,从文本中提取命名实体)。但是,Parsey McParseface默认情况下区分大小写。由于推文通常不使用大小写,我考虑使用无大小写标记。我在代码中发现了大写的一些内容,但我不确定是否以及如何使用它:
让我举个更清楚的例子。考虑例句John gave the money to Maria
和john gave the money to maria
(有案例和无案例):
有上限:
gave VBD ROOT
+-- John NNP nsubj
+-- money NN dobj
| +-- the DT det
+-- to IN prep
+-- Maria NNP pobj
没有上限:
gave VBD ROOT
+-- john NNP nsubj
+-- money NN dobj
| +-- the DT det
+-- to TO prep
+-- maria NN pobj
如你所见,玛丽亚是NNP,而玛丽亚(没有帽子)是NN。在提取命名实体时,如果一个单词被标记为NN或NNP,则会有所不同。
有没有办法改善这个?是不是没有用于语法网的Parsey McParseface?