运行Mahout示例的错误

时间:2011-08-04 02:46:25

标签: java mahout

我下载了“Mahout in Action”第09章的最新版本示例。我可以成功运行几个示例,但是对于三个文件,NewsKMeansClustering.java,ReutersToSparseVectors.java和NewsFuzzyKMeansClusteing.java。运行这三个程序会产生类似的错误消息:

  

2011年8月3日下午2:03:54 org.apache.hadoop.metrics.jvm.JvmMetrics init     信息:使用processName = JobTracker初始化JVM指标,sessionId =

     

2011年8月3日下午2:03:54 org.apache.hadoop.mapred.JobClient configureCommandLineOptions      警告:使用GenericOptionsParser解析参数。申请应该是      实现相同的工具。

     

2011年8月3日下午2:03:54 org.apache.hadoop.mapred.JobClient configureCommandLineOptions      警告:没有设置作业jar文件。可能找不到用户类。请参阅JobConf(Class)或      JobConf#setJar(字符串)。

     

线程“main”中的异常org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:file:/ home / user1 / workspaceMahout1 / recommender / inputDir

     

at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:224)

     

at org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat.listStatus(SequenceFileInputFormat.java:55)

     

at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:241)

     

at org.apache.hadoop.mapred.JobClient.writeNewSplits(JobClient.java:885)      在org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:779)      在org.apache.hadoop.mapreduce.Job.submit(Job.java:432)       在org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:447)

     

at org.apache.mahout.vectorizer.DocumentProcessor.tokenizeDocuments(DocumentProcessor.java:93)      在mia.clustering.ch09.NewsKMeansClustering.main(NewsKMeansClustering.java:54)

对于上述消息,我不太明白这两个警告是什么意思?而且,看起来应该创建“输入路径”,如何创建这种类型的输入?感谢。

2 个答案:

答案 0 :(得分:0)

您可以忽略警告。错误是您指定的输入目录不存在。它存在吗?你的命令行是什么?

答案 1 :(得分:0)

我遇到了类似的不匹配。 https://github.com/tdunning/MiA处的MiA文件存在某些情况,其中.csv文件与Java源文件保留在同一目录中。例如https://github.com/tdunning/MiA/tree/master/src/main/java/mia/recommender/ch02 ...但是通过Eclipse,使用DataModel model = new FileDataModel(new File(“intro.csv”))加载它; ......找不到。

添加

System.out.println("CWD: "+System.getProperty("user.dir"));

...将揭示Eclipse正在寻找的位置(在我的情况下,有几个级别在文件树上,但这可能会根据您设置的具体情况而有所不同)。