欧元符号(€)由Stanford NLP显示为$

时间:2017-02-03 11:47:15

标签: stanford-nlp

我们正试图从文档中提取EURO值。斯坦福正在按预期认可这笔钱。然而,在提取期间,它将€转换为$。

enter image description here

2 个答案:

答案 0 :(得分:1)

以下是运行Stanford CoreNLP并关闭货币规范化的示例命令:

java -Xmx8g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit -file sample-sentence.txt -outputFormat text -tokenize.options "normalizeCurrency=false"

答案 1 :(得分:0)

如果您使用corenlp作为专用服务器,则可以在发送请求时在URL中包含-tokenize.options参数。 例如。

http://corenlp.run?properties={"timeout":"36000","annotators":"tokenize,ssplit,parse,lemma,ner,regexner","tokenize.options":"normalizeCurrency=false,invertible=true"}