标签: hadoop mapreduce analytics aggregation
我试图理解近似中值聚合在hadoop中的工作原理,比如如何精确地做地图并减少。如果你能给我一个简短的例子,或者给我一些其他在线资源/材料,那就太棒了!
我的最终目标是在紧缩中制作一个近似的中位数聚合器。因此,我正在寻找一种能够以分布式方式进行聚合的良好算法/策略(详细信息)。