在我的代码中使用“SequenceFilesFromDirectory”的问题

时间:2011-08-05 16:48:10

标签: java eclipse mahout

我正在尝试编写一个可以调用的示例程序,使用“SequenceFilesFromDirectory”的main方法,该方法旨在将一组文件转换为序列文件格式。

public class TestSequenceFileConverter {
public static void main(String args[]){   
String inputDir = "inputDir";   
String outputDir = "outoutDir";
SequenceFilesFromDirectory.main(new String[] {"--input",
        inputDir.toString(), "--output", outputDir.toString(), "--chunkSize",
        "64", "--charset",Charsets.UTF_8.name()});
}
}

但Eclipse告诉我,我所做的是错误的以下错误消息

  

此行有多个标记        - 令牌“main”上的语法错误,=此后的预期        代币        - 令牌上的语法错误,错放的构造(s)        - 无法解析SequenceFilesFromDirectory

我想我没有正确使用这种方法,但我不知道如何修复它?非常感谢。

以下是SequenceFilesFromDirectory定义的方式。 SequenceFilesFromDirectory的API链接是http://search-lucene.com/jd/mahout/utils/org/apache/mahout/text/SequenceFilesFromDirectory.html

2 个答案:

答案 0 :(得分:0)

我的猜测是你错过了文件第一部分的导入行:

import org.apache.mahout.text.SequenceFilesFromDirectory;

答案 1 :(得分:0)

我认为您使用SequenceFilesFromDirectory的目的是将doc文件转换为序列文件。如果是这样,最好调用run()/ runSequential()/ runMapReduce()方法创建一个SequenceFilesFromDirectory对象,因为SequenceFilesFromDirectory.main()在内部调用haddop ToolRunner.run()方法进行处理。 而SequenceFilesFromDirectory的run方法执行实际处理。