标签: apache-spark statistics
我目前正在使用Scala处理Spark 1.6。我想获得整数列的分位数。不幸的是,Spark在1.6中没有任何分位数乐趣。但是,我发现我们在蜂巢中有percentile_approx()。这两者之间有什么显着差异吗?或者我可以只使用Percentile_approx而不是分位数?
percentile_approx()