NER干扰REGEXNER

时间:2015-09-18 00:23:57

标签: scala stanford-nlp named-entity-recognition

我使用regexner来查找不在默认的Stanford NLP集合中的命名实体,它运行正常。但是,当我添加ner注释器时,它会使用默认标签注释与我的正则表达式匹配的标记。如何覆盖默认注释?

def createNLPPipelineRegex(): StanfordCoreNLP = {
     val props = new Properties()
     props.put("regexner.mapping", "regex.txt")
     props.put("annotators", "tokenize, ssplit, regexner, pos, lemma, ner")
     props.put("tokenize.options", "untokenizable=noneKeep,normalizeParentheses=false")
     new StanfordCoreNLP(props)

}

1 个答案:

答案 0 :(得分:2)

如果你在ner注释器之后添加regexner它应该可以工作:

props.put("annotators", "tokenize, ssplit, pos, lemma, ner, regexner")