Question

我下载了“Mahout in Action”第09章的最新版本示例。我可以成功运行几个示例，但是对于三个文件，NewsKMeansClustering.java，ReutersToSparseVectors.java和NewsFuzzyKMeansClusteing.java。运行这三个程序会产生类似的错误消息：

2011年8月3日下午2:03:54 org.apache.hadoop.metrics.jvm.JvmMetrics init     信息：使用processName = JobTracker初始化JVM指标，sessionId =

2011年8月3日下午2:03:54 org.apache.hadoop.mapred.JobClient configureCommandLineOptions      警告：使用GenericOptionsParser解析参数。申请应该是      实现相同的工具。

2011年8月3日下午2:03:54 org.apache.hadoop.mapred.JobClient configureCommandLineOptions      警告：没有设置作业jar文件。可能找不到用户类。请参阅JobConf（Class）或      JobConf＃setJar（字符串）。

线程“main”中的异常org.apache.hadoop.mapreduce.lib.input.InvalidInputException：输入路径不存在：file：/ home / user1 / workspaceMahout1 / recommender / inputDir

at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus（FileInputFormat.java:224）

at org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat.listStatus（SequenceFileInputFormat.java:55）

at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits（FileInputFormat.java:241）

at org.apache.hadoop.mapred.JobClient.writeNewSplits（JobClient.java:885）      在org.apache.hadoop.mapred.JobClient.submitJobInternal（JobClient.java:779）      在org.apache.hadoop.mapreduce.Job.submit（Job.java:432）       在org.apache.hadoop.mapreduce.Job.waitForCompletion（Job.java:447）

at org.apache.mahout.vectorizer.DocumentProcessor.tokenizeDocuments（DocumentProcessor.java:93）      在mia.clustering.ch09.NewsKMeansClustering.main（NewsKMeansClustering.java:54）

对于上述消息，我不太明白这两个警告是什么意思？而且，看起来应该创建“输入路径”，如何创建这种类型的输入？感谢。

Answer 1

您可以忽略警告。错误是您指定的输入目录不存在。它存在吗？你的命令行是什么？

Answer 2

我遇到了类似的不匹配。 https://github.com/tdunning/MiA处的MiA文件存在某些情况，其中.csv文件与Java源文件保留在同一目录中。例如https://github.com/tdunning/MiA/tree/master/src/main/java/mia/recommender/ch02 ...但是通过Eclipse，使用DataModel model = new FileDataModel（new File（“intro.csv”））加载它; ......找不到。

添加

System.out.println("CWD: "+System.getProperty("user.dir"));

...将揭示Eclipse正在寻找的位置（在我的情况下，有几个级别在文件树上，但这可能会根据您设置的具体情况而有所不同）。

运行Mahout示例的错误

2 个答案: