标签: java hadoop mapreduce
我正在研究Hadoop地图功能。我想迭代数据一次(左 - >右),然后我想迭代数据(右 - >左)。
第一遍将为每个键设置一个值(但不发出它),然后第二遍将通过,如果它具有更好的值(在我的情况是一个较低的值)它将覆盖该值。该对将在第二次通过后发出。
我可以选择存储(不发出)键值对然后重新访问它们吗?
由于
答案 0 :(得分:0)
读取第一遍中的值并将它们存储到集合中。然后在第二次传递中匹配存储在集合中的值,当您从右向左阅读时。