标签: hadoop hdfs
我的问题是。
将在mapreduce作业中创建多少个mapper,处理两个非常小的文件,内容为:
文件1: 约翰一个 2玛丽
文件2: 彼得 布拉德
许多人将成为两名地图制作者?或者我们必须知道hdfs块的大小? 我们不能设置这么小的块大小。 最小块是64 MB?