标签: hadoop hive hadoop2
我们有一个用例,其中我们仅对约600个零件文件运行地图作业,进行一些增强,并在不同的目标位置生成600个名称和结构相同的对应输出零件文件。当前,我们正在使用HiveInputFormat,它可以生成600个Mapper,每个零件文件1个Mapper,并可以生成600个相应的输出零件文件,足以满足我们的要求。
我是hadoop的新手,非常感谢您的帮助。