我正在尝试将文本文件转换为可以运行mahout kmeans的序列文件。当我运行seqdirectory实用程序时,我没有收到任何错误,它表示程序已完成。但是,当我查看输出目录时,它是空的。我环顾四周,无法找到任何解决方案。想法?
这是我在终端中运行的内容: hduser @ ubuntu:〜$ $ MAHOUT_HOME / bin / mahout seqdirectory --input Downloads / google / --output Downloads / sparsefiles / -c UTF-8
这是我得到的输出: 12/07/06 06:24:19 INFO driver.MahoutDriver:程序花了1091毫秒(分钟:0.018183333333333333)
答案 0 :(得分:1)
我认为它可能会在hdfs上产生输出。尝试检查:
hadoop dfs -ls Downloads/sparsefiles/
另外,为了确保它在本地文件系统中生成,您可以修改命令,如:
$MAHOUT_HOME/bin/mahout seqdirectory --input file://<home path>/Downloads/google/ --output file://<home path>/Downloads/sparsefiles/ -c UTF-8