如何使用scipy.stats期待功能?

时间:2016-04-24 05:44:45

标签: python scipy statistics

我在期待

scipy.stats.norm.expect(loc = 55, scale = 1)

返回分布55的均值,而不是返回3.9096876333292135e-108。 我用错了吗?谁能向我解释这个功能是如何工作的。感谢

2 个答案:

答案 0 :(得分:1)

我认为这应该是一个错误。您已正确理解本手册,但事实证明,如果"loc"大于35.6,则事情会变得异常。否则,它按预期工作。

答案 1 :(得分:1)

问题:

import scipy.stats
#expect(func, loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)

for i in range(26, 55):
    print scipy.stats.norm.expect(loc=i,scale=1),

输出:

26.0
27.0
28.0
29.0
30.0
31.0
32.0
33.0
34.0
35.0
3.36373206533e-10
1.24696133938e-13
1.7005527212e-17
8.53164410131e-22
1.57463854604e-26
1.06913991702e-31
2.670507049e-37
2.45390887262e-43
8.29523418554e-50
1.03158350625e-56
4.71938759035e-64
7.94277793838e-72
4.91773037097e-80
1.12011477121e-88
9.38568238273e-98
2.89317497775e-107
3.28087032536e-117
1.4932849185e-127
3.63870849201e-118

对于较大的scale(标准差),行为的“截止”会进一步发展,正如您所期望的那样。

problem can be 'fixed' by setting the lower and upper bounds explicitly,如下所示:

import numpy as np

for i in np.arange(5,100,5):
    print i,scipy.stats.norm.expect(loc=55,lb=-i,ub=i,scale=1) 

输出:

5 0.0
10 0.0
15 0.0
20 2.01210143973e-267
25 1.05364770562e-196
30 7.87517644756e-137
35 8.61623210583e-88
40 1.40277331283e-49
45 3.46495136419e-22
50 1.42791169386e-05
55 27.1010577196
60 54.9999827474
65 55.0
70 55.0
75 55.0
80 55.0
85 55.0
90 55.0
95 55.0

但必须有一个微妙的错误。如果您查看source(请参阅类rv_continous init 方法),您会发现默认限制是作为Numpy的'inf'导入的。 如果明确地将限制作为+/- np.inf运行,则会获得与所描述的OP相同的行为:

for i in np.arange(5,60,5):
    print i,scipy.stats.norm.expect(loc=i,lb=-np.inf,ub=np.inf,scale=1) 

输出:

5 5.0
10 10.0
15 15.0
20 20.0
25 25.0000000007
30 30.0
35 35.0
40 1.57463854604e-26
45 1.03158350625e-56
50 9.38568238273e-98
55 3.90968763333e-108

另请注意,在sourceexpect的定义中,集成警告已被静音:

    # Silence floating point warnings from integration.
    olderr = np.seterr(all='ignore')
    vals = integrate.quad(fun, lb, ub, **kwds)[0] / invfac

问题的根源很可能是integrate.quad在给定为+/- np.inf时如何处理限制。实际source for the integration is in Fortran,但是在Wikipedia中给出了对无限区间(映射到有限范围,如同黎曼球)的数值积分的粗略描述。