我下载了“Mahout in Action”第09章的最新版本示例。我可以成功运行几个示例,但是对于三个文件,NewsKMeansClustering.java,ReutersToSparseVectors.java和NewsFuzzyKMeansClusteing.java。运行这三个程序会产生类似的错误消息:
2011年8月3日下午2:03:54 org.apache.hadoop.metrics.jvm.JvmMetrics init 信息:使用processName = JobTracker初始化JVM指标,sessionId =
2011年8月3日下午2:03:54 org.apache.hadoop.mapred.JobClient configureCommandLineOptions 警告:使用GenericOptionsParser解析参数。申请应该是 实现相同的工具。
2011年8月3日下午2:03:54 org.apache.hadoop.mapred.JobClient configureCommandLineOptions 警告:没有设置作业jar文件。可能找不到用户类。请参阅JobConf(Class)或 JobConf#setJar(字符串)。
线程“main”中的异常org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:file:/ home / user1 / workspaceMahout1 / recommender / inputDir
at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:224)
at org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat.listStatus(SequenceFileInputFormat.java:55)
at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:241)
at org.apache.hadoop.mapred.JobClient.writeNewSplits(JobClient.java:885) 在org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:779) 在org.apache.hadoop.mapreduce.Job.submit(Job.java:432) 在org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:447)
at org.apache.mahout.vectorizer.DocumentProcessor.tokenizeDocuments(DocumentProcessor.java:93) 在mia.clustering.ch09.NewsKMeansClustering.main(NewsKMeansClustering.java:54)
对于上述消息,我不太明白这两个警告是什么意思?而且,看起来应该创建“输入路径”,如何创建这种类型的输入?感谢。
答案 0 :(得分:0)
您可以忽略警告。错误是您指定的输入目录不存在。它存在吗?你的命令行是什么?
答案 1 :(得分:0)
我遇到了类似的不匹配。 https://github.com/tdunning/MiA处的MiA文件存在某些情况,其中.csv文件与Java源文件保留在同一目录中。例如https://github.com/tdunning/MiA/tree/master/src/main/java/mia/recommender/ch02 ...但是通过Eclipse,使用DataModel model = new FileDataModel(new File(“intro.csv”))加载它; ......找不到。
添加
System.out.println("CWD: "+System.getProperty("user.dir"));
...将揭示Eclipse正在寻找的位置(在我的情况下,有几个级别在文件树上,但这可能会根据您设置的具体情况而有所不同)。