我遇到了这个错误:
我运行了OpenIE 4.1二进制文件但出现了以下错误:
Exception in thread "main" java.lang.NullPointerException at
com.googlecode.clearnlp.tokenization.EnglishTokenizer.protectEmoticons
(EnglishTokenizer.java:335) at
com.googlecode.clearnlp.tokenization.EnglishTokenizer.getTokenList(En
glishTokenizer.java:109) at
com.googlecode.clearnlp.tokenization.AbstractTokenizer.getTokens(AbstractTokenizer.java:58) at
edu.knowitall.tool.tokenize.ClearTokenizer.tokenize(ClearTokenizer.sc ala:22)
我查了几个消息来源并发现Yangrui的评论,过去也有这个问题。但是没有解决方案。我检查了我的openie.4.1.jar文件,并且存在com.googlecode.clearnlp.tokenization.EnglishTokenizer.protectEmoticon。
希望有人可以帮助阐明这一点。提前谢谢。
答案 0 :(得分:1)
我设法解决了这个错误。问题在于我从官方网站下载的OpenIE 4.0 JAR和OpenIE 4.1 JAR文件的编译。 (http://knowitall.github.io/openie/)。
如何解决?自己编译类。
注意:如果您将OpenIE作为依赖项运行,则可能需要对代码进行一些更改。测试代码如下:
OpenIE openIE = new OpenIE(new ClearParser(new ClearPostagger(new ClearTokenizer())), new ClearSrl(), false, false);
Seq<Instance> extractions = openIE.extract("Obama is the president of the United States");
Iterator<Instance> iterator = extractions.iterator();
while (iterator.hasNext()) {
Instance inst = iterator.next();
StringBuilder sb = new StringBuilder();
sb.append(inst.confidence()).append("\t\t")
.append(inst.extr().arg1().text()).append("\t\t")
.append(inst.extr().rel().text()).append("\t\t");
Iterator<Argument> argIter = inst.extr().arg2s().iterator();
while (argIter.hasNext()) {
Part arg = argIter.next();
sb.append(arg.text()).append("; ");
}
System.out.println(sb.toString());
}
我希望这将有助于将来。