使用Illinois Chunker

时间:2014-06-04 21:51:08

标签: java nlp

我正在尝试使用illinois chunker从文本中提取名词短语但是我似乎遇到了错误。我试图在centos6.4系统中运行命令,jdk1.8下载了链接中给出的jar。

java -Xmx512m -classpath /path/to/LBJChunk.jar edu.illinois.cs.cogcomp.lbj.chunk.ChunksAndPOSTags snippeting.txt

这会返回一个未找到类的异常,我做错了什么> :(我是否必须为解析器下载另一个jar?

Exception in thread "main" java.lang.NoClassDefFoundError: LBJ2/parse/Parser
        at java.lang.Class.getDeclaredMethods0(Native Method)
        at java.lang.Class.privateGetDeclaredMethods(Class.java:2688)
        at java.lang.Class.getMethod0(Class.java:2937)
        at java.lang.Class.getMethod(Class.java:1771)
        at sun.launcher.LauncherHelper.validateMainClass(LauncherHelper.java:544)
        at sun.launcher.LauncherHelper.checkAndLoadMain(LauncherHelper.java:526)
Caused by: java.lang.ClassNotFoundException: LBJ2.parse.Parser
        at java.net.URLClassLoader$1.run(URLClassLoader.java:372)
        at java.net.URLClassLoader$1.run(URLClassLoader.java:361)
        at java.security.AccessController.doPrivileged(Native Method)
        at java.net.URLClassLoader.findClass(URLClassLoader.java:360)
        at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
        at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:308)
        at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
        ... 6 more

1 个答案:

答案 0 :(得分:4)

你需要在类路径上有更多的jar。目前还不是很清楚,但是对于chunker的描述需要注意LBJ(语言库)和Illinois POS标记器。您可以获取有关如何运行它的更多信息here.

然后,运行以下命令:

java -classpath /path/to/LBJChunk.jar:/path/to/LBJ2Library.jar:/path/toLBJPOS.jar \
      edu.illinois.cs.cogcomp.lbj.chunk.ChunksAndPOSTags snippeting.txt

这应该有用!