如何从PHP中的双精度数组计算第n个百分位数?

时间:2014-06-04 22:49:00

标签: php math statistics

我有大量的双打,我需要计算数组的第75和第90百分位值。通过函数实现此目的的最有效方法是什么?

3 个答案:

答案 0 :(得分:17)

自统计以来已经有一段时间了,所以我可能会离开这里 - 但这里有一个裂缝。

function get_percentile($percentile, $array) {
    sort($array);
    $index = ($percentile/100) * count($array);
    if (floor($index) == $index) {
         $result = ($array[$index-1] + $array[$index])/2;
    }
    else {
        $result = $array[floor($index)];
    }
    return $result;
}

$scores = array(22.3, 32.4, 12.1, 54.6, 76.8, 87.3, 54.6, 45.5, 87.9);

echo get_percentile(75, $scores);
echo get_percentile(90, $scores);

答案 1 :(得分:4)

如果您使用较高的百分比值(100)并且未根据Excel PERCENTILE函数返回正确的值,则上面的答案可能会抛出未定义的索引通知。你可以see here an example of how it fails

我根据Wikipedia第二个变量来编写PHP函数,这是Excel中使用的变量。此功能也受到保护,不受非百分比值的限制(超出范围)。

function getPercentile($array, $percentile)
{
    $percentile = min(100, max(0, $percentile));
    $array = array_values($array);
    sort($array);
    $index = ($percentile / 100) * (count($array) - 1);
    $fractionPart = $index - floor($index);
    $intPart = floor($index);

    $percentile = $array[$intPart];
    $percentile += ($fractionPart > 0) ? $fractionPart * ($array[$intPart + 1] - $array[$intPart]) : 0;

    return $percentile;
}

答案 2 :(得分:0)

基于上述Mark的功能,我认为该功能实际上应该是:

function get_percentile($percentile, $array) {
    sort($array);
    $index = (($percentile/100) * (count($array))-1;
    if (floor($index) == $index) {
         return $array[$index];
    }
    else {
        return ($array[floor($index)] + $array[ceiling($index)])/2;
    }
}

我认为需要纠正三件事:

  1. 需要将count减少1,以避免超出范围的索引(如上所述)
  2. 如果计算出的index是整数,那么您应该能够只返回索引。仅当index不是整数时,才需要取平均值。
  3. 对于平均值,最好使用floorceiling来使索引取平均值,而不是从索引中任意减去一个。