我们在使用Hadoop和运行CentOS的Virtual Box时使用BigData。每当我们执行某些程序时,它都会创建2个不同的文件1)part-r-00000和2)part-m-00000。那么这两个文件的区别和目的是什么?
答案 0 :(得分:1)
这些是MapReduce作业生成的文件。 override func viewDidLoad() {
pickerUI.dataSource = self
pickerUI.delegate = self
}
表示文件已由Reducer输出,r
表示文件已由Mapper输出。
答案 1 :(得分:1)
默认情况下,输出文件名为part-x-yyyyy
其中:
1)x
是‘m’
或‘r
',具体取决于作业是仅 map 个作业还是 reduce
2)yyyyy
是Mapper或Reducer 任务编号(从零开始的(00000
)
因此,如果一个作业包含10个化简器,则生成的文件将命名为part-r-0000
0到part-r-0000
9,每个化简器任务一个。
可以更改默认名称。
这是您需要在Driver类中更改输出文件的默认值的所有操作:
job.getConfiguration().set(“mapreduce.output.basename”, “Neo”)
;
因此,这将导致您的文件名为“Neo-r-00000”
。