我有大量的双打,我需要计算数组的第75和第90百分位值。通过函数实现此目的的最有效方法是什么?
答案 0 :(得分:17)
自统计以来已经有一段时间了,所以我可能会离开这里 - 但这里有一个裂缝。
function get_percentile($percentile, $array) {
sort($array);
$index = ($percentile/100) * count($array);
if (floor($index) == $index) {
$result = ($array[$index-1] + $array[$index])/2;
}
else {
$result = $array[floor($index)];
}
return $result;
}
$scores = array(22.3, 32.4, 12.1, 54.6, 76.8, 87.3, 54.6, 45.5, 87.9);
echo get_percentile(75, $scores);
echo get_percentile(90, $scores);
答案 1 :(得分:4)
如果您使用较高的百分比值(100)并且未根据Excel PERCENTILE函数返回正确的值,则上面的答案可能会抛出未定义的索引通知。你可以see here an example of how it fails。
我根据Wikipedia第二个变量来编写PHP函数,这是Excel中使用的变量。此功能也受到保护,不受非百分比值的限制(超出范围)。
function getPercentile($array, $percentile)
{
$percentile = min(100, max(0, $percentile));
$array = array_values($array);
sort($array);
$index = ($percentile / 100) * (count($array) - 1);
$fractionPart = $index - floor($index);
$intPart = floor($index);
$percentile = $array[$intPart];
$percentile += ($fractionPart > 0) ? $fractionPart * ($array[$intPart + 1] - $array[$intPart]) : 0;
return $percentile;
}
答案 2 :(得分:0)
基于上述Mark的功能,我认为该功能实际上应该是:
function get_percentile($percentile, $array) {
sort($array);
$index = (($percentile/100) * (count($array))-1;
if (floor($index) == $index) {
return $array[$index];
}
else {
return ($array[floor($index)] + $array[ceiling($index)])/2;
}
}
我认为需要纠正三件事:
count
减少1,以避免超出范围的索引(如上所述)index
是整数,那么您应该能够只返回索引。仅当index
不是整数时,才需要取平均值。floor
和ceiling
来使索引取平均值,而不是从索引中任意减去一个。