为了我自己的理解,我试图深入stats.pearsonr
。我想将r, p = stats.pearsonr(x, y)
写成一些独立的代码(见下文)。我可以重现r
,但是p值计算会使用scipy.special.betainc
。我在https://github.com/scipy/scipy/tree/master/scipy/special进行了翻找,但无法找到betainc
(我猜测它可能是一些基础C代码)。知道我在哪里可以找到它的源代码吗?
import numpy as np
x = np.random.rand(100)
y = np.random.rand(100)
n = len(x)
mx = x.mean()
my = y.mean()
xm, ym = x - mx, y - my
r_num = np.add.reduce(xm * ym)
r_den = np.sqrt(np.sum(xm*xm, 0) * np.sum(ym*ym, 0))
r = r_num / r_den
r = max(min(r, 1.0), -1.0)
df = n - 2
if abs(r) == 1.0:
p = 0.0
else:
t_squared = r**2 * (df / ((1.0 - r) * (1.0 + r)))
# Now code https://github.com/scipy/scipy/blob/14142ff70d84a6ce74044a27919c850e893648f7/scipy/stats/stats.py#L3020
_x = df/(df+t_squared)
_x = np.asarray(_x)
_x = np.where(_x < 1.0, _x, 1.0)
_a = 0.5*df
_b = 0.5
# Code special.betainc(_a, _b, _x)
答案 0 :(得分:2)
scipy.special.betainc
基于scipy/special/cephes/incbet.c
中的incbet
,这是Cephes Math Library中的一项功能。
我在searching为SciPy Github存储库中的betainc
找到了这个,这导致我scipy/special/functions.json
,这导致我incbet
。