标签: java algorithm hadoop
我需要使用hadoop实现Equidepth直方图的逻辑。
假设我们有以下测试数据:
10, 11, 14, 16, 80, 90, 65
我如何使用等深度直方图?
我必须变量params,每个桶的项目数和每个桶的项目。
params
我该如何实施?
我认为逻辑是找到等宽直方图。计算平均频率。并在输入数据上再次执行map reduce。如果是这样,如何读取两个输入文件(输入数据和map reduce 1的结果)
还有其他逻辑吗?