为什么np.percentile会为高百分位数返回NaN?

时间:2015-06-15 00:45:23

标签: python numpy pandas

此代码:

print len(my_series)
print np.percentile(my_series, 98)
print np.percentile(my_series, 99)

给出:

14221  # This is the series length
1644.2  # 98th percentile
nan  # 99th percentile?

为什么98可以正常工作但99给出nan

1 个答案:

答案 0 :(得分:3)

np.percentile将nan的数字视为非常高/无限的数字。因此,高百分位数将在您最终获得纳米的范围内。在你的情况下,你的数据的1%到2%将是nan(第98个百分位将返回一个数字(实际上不是所有有效值的第98个百分点),第99个将返回你的数字)。

要计算没有nan的百分位数,你可以使用np.nanpercentile()

所以:

print np.nanpercentile(my_series, 98)
print np.nanpercentile(my_series, 99)