Question

我尝试使用StanfordSegmenter来分割一段中文，但遇到了上述问题。我首先从http://nlp.stanford.edu/software/segmenter.shtml

下载了Stanford Word Segmenter版本3.5.2

然后我写了一篇python：

import os
os.environ['JAVAHOME'] = "C:/Program Files/Java/jdk1.8.0_102/bin/java.exe"
from nltk.tokenize.stanford_segmenter import StanfordSegmenter
segmenter = StanfordSegmenter(path_to_jar = "./stanford-segmenter-2015-12-09/stanford-segmenter-3.6.0.jar", 
                          path_to_slf4j = "./stanford-segmenter-2015-12-09/slf4j-api.jar",
                          path_to_sihan_corpora_dict = "./stanford-segmenter-2015-12-09/data",
                          path_to_model = "./stanford-segmenter-2015-12-09/data/pku.gz", 
                          path_to_dict = "./stanford-segmenter-2015-12-09/data/dict-chris6.ser.gz")
sentence = u"这是斯坦福中文分词器测试"
segmenter.segment(sentence)

但是我收到了以下错误：

Error: Could not find or load main class edu.stanford.nlp.ie.crf.CRFClassifier

我在哪里犯错？感谢。

Answer 1

我认为存在一些实现错误。我也有类似的问题。要解决此错误，请尝试执行

<强> segmenter._stanford_jar =＆＃34; ./斯坦福-分段-2015年12月9日/斯坦福-分段-3.6.0.jar＆＃34;

如果没有尝试在segmenter._stanford_jar上提供segementer jar文件的完整路径

错误：无法找到或加载主类edu.stanford.nlp.ie.crf.CRFClassifier

1 个答案: