我正在尝试编写一个可以调用的示例程序,使用“SequenceFilesFromDirectory”的main方法,该方法旨在将一组文件转换为序列文件格式。
public class TestSequenceFileConverter {
public static void main(String args[]){
String inputDir = "inputDir";
String outputDir = "outoutDir";
SequenceFilesFromDirectory.main(new String[] {"--input",
inputDir.toString(), "--output", outputDir.toString(), "--chunkSize",
"64", "--charset",Charsets.UTF_8.name()});
}
}
但Eclipse告诉我,我所做的是错误的以下错误消息
此行有多个标记 - 令牌“main”上的语法错误,=此后的预期 代币 - 令牌上的语法错误,错放的构造(s) - 无法解析SequenceFilesFromDirectory
我想我没有正确使用这种方法,但我不知道如何修复它?非常感谢。
以下是SequenceFilesFromDirectory定义的方式。 SequenceFilesFromDirectory的API链接是http://search-lucene.com/jd/mahout/utils/org/apache/mahout/text/SequenceFilesFromDirectory.html
答案 0 :(得分:0)
我的猜测是你错过了文件第一部分的导入行:
import org.apache.mahout.text.SequenceFilesFromDirectory;
答案 1 :(得分:0)
我认为您使用SequenceFilesFromDirectory的目的是将doc文件转换为序列文件。如果是这样,最好调用run()/ runSequential()/ runMapReduce()方法创建一个SequenceFilesFromDirectory对象,因为SequenceFilesFromDirectory.main()在内部调用haddop ToolRunner.run()方法进行处理。 而SequenceFilesFromDirectory的run方法执行实际处理。