ClearNLP(NLP4J)解析器错误执行

时间:2016-05-06 10:06:08

标签: java parsing clearnlp

我正在尝试用ClearParser训练,我得到了这个错误。在执行命令之前,我将导出school.xxx并执行CLASSPATH=nlp4j-1.1.0.jar:.我获取版本信息,因此它已正确安装。

命令行:java edu.emory.mathcs.nlp.bin.Version

我正在使用此配置文件:https://github.com/emorynlp/nlp4j/blob/master/src/main/resources/edu/emory/mathcs/nlp/configuration/config-train-dep.xml

java -Xmx5g -XX:+UseConcMarkSweepGC edu.emory.mathcs.nlp.bin.NLPTrain -mode dep -c config-train-dep.xml -t /home/iago/Escritorio/idiomasClearParser/UD_English/en-ud-train.conllu -d /home/iago/Escritorio/idiomasClearParser/UD_English/en-ud-dev.conllu -m bestModel-dep.xz

为什么我收到此错误?我解压缩.jar并且没有“lexica”文件夹也没有“en-brown-clusters-simplified-lowercase.xz”。在哪里可以找到它?

此致

1 个答案:

答案 0 :(得分:0)

我找到了解决方案,发生此错误是因为您没有配置“log4j.properties”,因此“nlp4j”无法找到它。要解决此问题,只需使用此简单代码在.jar的同一文件夹上创建文件(如果您需要更多详细信息以满足您的需求)

# Root logger option 
log4j.rootLogger=INFO, file, stdout
# Direct log messages to a log file
log4j.appender.file=org.apache.log4j.RollingFileAppender
log4j.appender.file.File= /path/to/file
log4j.appender.file.MaxFileSize=5MB #Set what you need
log4j.appender.file.MaxBackupIndex=10
log4j.appender.file.layout=org.apache.log4j.PatternLayout
log4j.appender.file.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss} %-5p %c{1}:%L - %m%n

# Direct log messages to stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.Target=System.out
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss} %-5p %c{1}:%L - %m%n
而且,要解决lexica的问题。转到此网址并下载广告lexica url

然后,在config xml上设置正确的jar路径。

现在它应该有效。希望它可以帮到某人。