Map Reduce如何确保跨不同文件分割的单个xml记录的所有数据都转到同一个映射器

时间:2014-10-17 19:00:52

标签: hadoop mapreduce

我有大量的XML记录分为不同的文件。现在如果记录在文件1中开始但不在那里结束。相反,它继续在其他文件中说File10。 Map Reduce框架将如何识别记录的剩余部分以便由同一个映射器处理?

0 个答案:

没有答案