此代码:
print len(my_series)
print np.percentile(my_series, 98)
print np.percentile(my_series, 99)
给出:
14221 # This is the series length
1644.2 # 98th percentile
nan # 99th percentile?
为什么98可以正常工作但99给出nan
?
答案 0 :(得分:3)
np.percentile将nan的数字视为非常高/无限的数字。因此,高百分位数将在您最终获得纳米的范围内。在你的情况下,你的数据的1%到2%将是nan(第98个百分位将返回一个数字(实际上不是所有有效值的第98个百分点),第99个将返回你的数字)。
要计算没有nan的百分位数,你可以使用np.nanpercentile()
所以:
print np.nanpercentile(my_series, 98)
print np.nanpercentile(my_series, 99)