如何使用斯坦福大学的NER来反对西班牙语文本?
我已经成功下载了斯坦福大学的NER系统,并且我能够使用以下命令提取命名实体:
#!/bin/sh
scriptdir=`dirname $0`
java -mx700m -cp "$scriptdir/stanford-ner.jar:$scriptdir/lib/*" edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier $scriptdir/classifiers/english.all.3class.distsim.crf.ser.gz -textFile $1
但我真的想处理西班牙语文本。我看到某种西班牙语jar文件可用(stanford-spanish-corenlp-2016-10-31-models.jar)。不幸的是,我不知道如何在给定的NER系统中使用它。
如何使用斯坦福NER系统对抗西班牙语数据?
答案 0 :(得分:0)
以下是一个示例命令:
java -Xmx8g edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-spanish.properties -file sample-text.txt -outputFormat text
您需要确保CLASSPATH中有西班牙模型jar。