我正在计算经验CDF如下:
>> import numpy as np
>>> from statsmodels import api
>>> sorted_list = [1,2,3,4,5,6,6,7,7,100,150]
>>> const_npoints = 10
>>> xvals = np.linspace(sorted_list[0], sorted_list[-1], const_npoints)
>>> ecdf = api.distributions.ECDF(sorted_list)
>>> yvals = ecdf(xvals)
>>> print xvals
[ 1. 17.55555556 34.11111111 50.66666667 67.22222222
83.77777778 100.33333333 116.88888889 133.44444444 150. ]
>>> print yvals
[ 0.09090909 0.81818182 0.81818182 0.81818182 0.81818182 0.81818182
0.90909091 0.90909091 0.90909091 1. ]
从上面您可以看到yvals
缺少在sorted_list
开头发生的重要信息。这是因为我的linspace
函数创建了等间距值。有没有办法生成xvals
来表示sorted_list
的分布?