使用Apache Mahout的TFIDF“失败了!”当应用运行时

时间:2018-04-11 19:20:32

标签: java eclipse machine-learning mahout tf-idf

我想使用来自http://technobium.com/tfidf-explained-using-apache-mahout/的Apache Mahout运行简单的应用。但!当应用程序运行时,我有一些例外:

Exception in thread "main" java.lang.IllegalStateException: Job failed!
    at org.apache.mahout.vectorizer.DictionaryVectorizer.startWordCounting(DictionaryVectorizer.java:369)
    at org.apache.mahout.vectorizer.DictionaryVectorizer.createTermFrequencyVectors(DictionaryVectorizer.java:180)
    at my.package.text_extractor.clasterization.TFIDFTester.calculateTfIdf(TFIDFTester.java:97)
    at my.package.text_extractor.clasterization.TFIDFTester.main(TFIDFTester.java:35) 

但是,我不知道如何解决它。也许您知道如何解决 Apache Mahout lib 中的这个问题?请给我一些想法!

配置:
Windows 7 x64, Eclipse Oxigen 1a,Maven,Mahout-core-0.9

1 个答案:

答案 0 :(得分:0)

当我的分析器内部类和构造函数设为非公开时,这是基于相同示例代码(technobium)的程序发生的。它们通过反射实例化(糟糕)。

不幸的是,抛出的异常非常无助。