无法使用regexner.mapping在CoreNLPServer中定义自定义ner

时间:2018-10-19 07:46:15

标签: stanford-nlp

当我使用CoreNLP命令之类的时候

java -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP \
-regexner.mapping jg-regexner.txt -annotators \
tokenize,ssplit,pos,lemma,ner,regexner -outputFormat json

jg-regexner.txt类似于something to be matched\tcustom_ner

可以,我的自定义ner会显示在结果中。

但是,当我尝试使用以下命令启动服务器时:

java -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer \
-regexner.mapping jg-regexner.txt

一切都很好,但是jg-regexner.txt中定义的自定义regexner无效。

所以我想知道regexner.mapping在StanfordCoreNLPServer中是否无效,如果是,该如何定义自定义正则表达式模式?

我也尝试了tokensRegex,但是失败了。也许是因为我不知道如何设置pattern参数。

1 个答案:

答案 0 :(得分:0)

我解决了!

只需将此属性添加到请求中,而不是在启动命令中添加

http://url/?properties={"annotators":...,"regexner.mapping":"jg-regexner.txt"}

但我认为这不是一个好主意...