当我使用CoreNLP命令之类的时候
java -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP \
-regexner.mapping jg-regexner.txt -annotators \
tokenize,ssplit,pos,lemma,ner,regexner -outputFormat json
jg-regexner.txt类似于something to be matched\tcustom_ner
。
可以,我的自定义ner会显示在结果中。
但是,当我尝试使用以下命令启动服务器时:
java -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer \
-regexner.mapping jg-regexner.txt
一切都很好,但是jg-regexner.txt中定义的自定义regexner无效。
所以我想知道regexner.mapping
在StanfordCoreNLPServer中是否无效,如果是,该如何定义自定义正则表达式模式?
我也尝试了tokensRegex,但是失败了。也许是因为我不知道如何设置pattern参数。
答案 0 :(得分:0)
我解决了!
只需将此属性添加到请求中,而不是在启动命令中添加
http://url/?properties={"annotators":...,"regexner.mapping":"jg-regexner.txt"}
但我认为这不是一个好主意...