标签: hadoop mapreduce
假设我想对产品的年度销售趋势进行一些研究。在原始输入中,我将所有产品逐行排序,如下所示:product-id sales-volume year。在映射器中,我会生成<product-id, sales-volume>对,因此在Reducer中我可以获得同一产品的所有销售数据。问题是:是否保证Reducer中的值顺序与原始输入相同?如果不是,我该怎么做?
product-id sales-volume year
<product-id, sales-volume>