标签: hadoop mapreduce
我有大量的XML记录分为不同的文件。现在如果记录在文件1中开始但不在那里结束。相反,它继续在其他文件中说File10。 Map Reduce框架将如何识别记录的剩余部分以便由同一个映射器处理?