标签: hadoop multipleoutputs
在hadoop中以多输出格式使用part-m-00000文件。
我尝试创建多个文件但不存在完整数据,将所有多个输出文件组合在一起。 part-m -00000文件为0字节。
答案 0 :(得分:0)
你需要放LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class); 在工作下摆脱part-m-00000。你能否详细说明"不存在完整数据"?
LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class);