应用错误收集

我们可以使用百分位而不是分位数

时间：2017-01-02 07:30:50

标签： apache-spark statistics

我目前正在使用Scala处理Spark 1.6。我想获得整数列的分位数。不幸的是，Spark在1.6中没有任何分位数乐趣。但是，我发现我们在蜂巢中有percentile_approx()。这两者之间有什么显着差异吗？或者我可以只使用Percentile_approx而不是分位数？

0 个答案:

没有答案