用于NER标记的TokensRegex表达式

时间:2016-09-14 14:19:05

标签: nlp stanford-nlp

我正在使用斯坦福大学的核心NLP api从某些文本中获取NER标签。我有一个规则,如果一个名词后跟一个缩写,那么该名词应该被标记为PERSON,我正在使用regexner来实现这个规则。在映射文件中,我有两个规则

(?:[A-Z]\.{0,1}){2,10}\tABBR
( [ {ner:ABBR} ] [ {tag:NN} ] )\tPERSON

\ t表示该位置有一个标签。 ABBR表示缩写。标记令牌的规则是缩写(第一个规则)正常工作,但第二个规则似乎不起作用,即,如果名词后跟缩写,则名词不被标记为PERSON。我想知道我在这里使用TokensRegex表达式做错了什么。

0 个答案:

没有答案