使用像Stanford NLP或Apache OpenNLP这样的NER软件,在训练模型识别人名时,我是否必须将标题与名称一起包括在内?
例如使用Apache
<START:person> Robert M. Haugh, MD <END>
signed by <START:person> Dr. Holt B. Zolt <END>
VS
<START:person> Robert M. Haugh, <END> MD
signed by Dr. <START:person> Holt B. Zolt <END>
或使用斯坦福
At O
the O
request O
of O
Dr. PERS
Kelly PERS
Schmeick PERS
on O
VS
At O
the O
request O
of O
Dr. O
Kelly PERS
Schmeick PERS
on O
答案 0 :(得分:0)
传统上,标题不是PERSON名称的一部分,而是获得它自己的TITLE标记。我们基于NER的细粒度模式检测标题,但是4级统计模型不检测标题。