我正在使用IKVM.NET使用StandordCoreNLP。有没有办法指定解析器模型的路径
var pipeLine = new StanfordCoreNLP(props);
抛出异常:
java.lang.RuntimeException: java.io.IOException: Unable to resolve
"edu/stanford/nlp/models/pos-tagger/english-left3words/english-left3words-distsim.tagger"
as either class path, filename or URL
答案 0 :(得分:6)
了解您如何定义属性会很有帮助。如果您使用了默认属性,那么您可能只是在类路径中缺少models.jar(如版本3.2的this one)。下载它并确保它被加载。
如果以其他方式配置属性,则字符串中可能存在导致IO错误的语法错误。这是我加载不同pos.model
的自定义属性的样子:
Properties props = new Properties();
// using wsj-bidirectional model
props.put("pos.model", "edu/stanford/nlp/models/pos-tagger/wsj-bidirectional/wsj-0-18-bidirectional-distsim.tagger");
// using standard pipeline
props.put("annotators", "tokenize, ssplit, pos, lemma, parse");
// create pipeline
StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
重要的是要注意路径中没有前导斜杠/
。
如果这没有帮助,请查看Galal Aly's tutorial,其中从模型文件中提取标记器并单独加载。
答案 1 :(得分:6)
如果您未在类路径中包含models.jar,那么这是完整的属性集。
Properties props = new Properties();
String modPath = "<YOUR PATH TO MODELS>/models3.4/edu/stanford/nlp/models/";
props.put("pos.model", modPath + "pos-tagger/english-left3words/english-left3words-distsim.tagger");
props.put("ner.model", modPath + "ner/english.all.3class.distsim.crf.ser.gz");
props.put("parse.model", modPath + "lexparser/englishPCFG.ser.gz");
props.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse, dcoref");
props.put("sutime.binders","0");
props.put("sutime.rules", modPath + "sutime/defs.sutime.txt, " + modPath + "sutime/english.sutime.txt");
props.put("dcoref.demonym", modPath + "dcoref/demonyms.txt");
props.put("dcoref.states", modPath + "dcoref/state-abbreviations.txt");
props.put("dcoref.animate", modPath + "dcoref/animate.unigrams.txt");
props.put("dcoref.inanimate", modPath + "dcoref/inanimate.unigrams.txt");
props.put("dcoref.big.gender.number", modPath + "dcoref/gender.data.gz");
props.put("dcoref.countries", modPath + "dcoref/countries");
props.put("dcoref.states.provinces", modPath + "dcoref/statesandprovinces");
props.put("dcoref.singleton.model", modPath + "dcoref/singleton.predictor.ser");
答案 2 :(得分:2)
我不知道您是否可以使用IKVM.NET从jar文件访问资源,但您当然可以解压缩jar文件以获取常规操作系统文件(jar -xf models.jar
)并将模型加载为文件。您需要镜像jar文件的目录结构(使用上面的示例路径,并使用相对路径),或者您需要为props文件中的所有模型设置属性,以提供它们可以通过的文件路径找到。请参阅pos.model
,ner.model
,parse.model
等
答案 3 :(得分:1)
我有同样的问题。在我的情况下,我没有使用完整的.jar文件,而是提取了.tagger文件。我刚刚在制作了这样的属性对象之后手动添加了模型:
Properties props = new Properties();
**props.put("pos.model", "E:\\Documents\\Dependencies\\english-left3words-distsim.tagger");**