标签: hadoop statistics correlation
如果我想计算网格上大量数据的相关性(http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient)以及大量维度(我想在哪个维度上计算与结果的相关性),我想知道是否存在或更智能的Hadoop网格实现方式?
Pig / Java / Python实现是首选。 :)