Stanford Word Segmenter的下载包,例如 http://nlp.stanford.edu/software/stanford-segmenter-2015-01-29.zip 不包括任何源代码,但网页 http://nlp.stanford.edu/software/segmenter.shtml 建议它应该:“下载是一个压缩文件,包含模型文件,编译代码和源文件”。下载确实包含一个build.xml文件,但缺少src目录意味着ant不起作用(特别抱怨它无法找到预期的src目录)。 并且似乎需要src,因为没有重新编译,尝试使用演示脚本导致“不支持的major.minor版本52.0”错误。
答案 0 :(得分:0)
源代码包含在名为stanford-segmenter-3.5.1-sources.jar
的jar文件中。所有这些来源也包含在较大的CoreNLP包中,您可以浏览其来源on GitHub。
并且似乎需要src,因为没有重新编译,尝试使用演示脚本导致" Unsupported major.minor版本52.0"错误。
斯坦福NLP工具版本3.5及更高版本需要Java 8.您需要更新JDK版本或降级到Segmenter 3.4.1(这是与Java 7兼容的最新版本)。