线性回归的单侧t检验?

时间:2017-04-13 10:48:33

标签: python pandas scikit-learn statsmodels t-test

我有这个问题。我正在尝试进行线性回归并测试斜率。 t检验检查斜率是否远离0.斜率可以是负的或正的。我只对负斜率感兴趣。

在这个例子中,斜率为正,我不感兴趣,因此P值应该很大。但它很小,因为现在它测试斜率是否远离0,在任何一个方向。 (我强迫拦截零,这就是我想要的)。有人可以帮助我使用语法来查看斜率是否只是负数。在这种情况下,P值应该很大。

我怎样才能改变,说99%的置信水平或95%或......?

import statsmodels.api as sm
import matplotlib.pyplot as plt
import numpy
X = [-0.013459134, 0.01551033, 0.007354476, 0.014686473, -0.014274754, 0.007728445, -0.003034186, -0.007409397]
Y = [-0.010202462, 0.003297546, -0.001406498, 0.004377665, -0.009244517, 0.002136552, 0.006877126, -0.001494624]
regression_results = sm.OLS (Y, X, missing = "drop").fit ()
P_value = regression_results.pvalues [0]
R_squared = regression_results.rsquared
K_slope = regression_results.params [0]
conf_int = regression_results.conf_int ()
low_conf_int = conf_int [0][0]
high_conf_int = conf_int [0][1]
fig, ax = plt.subplots ()
ax.grid (True)
ax.scatter (X, Y, alpha = 1, color='orchid')
x_pred = numpy.linspace (min (X), max (X), 40)
y_pred = regression_results.predict (x_pred)
ax.plot (x_pred, y_pred, '-', color='darkorchid', linewidth=2)

1 个答案:

答案 0 :(得分:3)

双向t检验的p值由下式计算:

message_id

您的修改只会是:

import scipy.stats as ss
df = regression_results.df_resid
ss.t.sf(regression_results.tvalues[0], df) * 2 # About the same as (1 - cdf) * 2.
# see @user333700's comment
Out[12]: 0.02903685649821508

因为你只对左尾感兴趣。

对于置信区间,您只需传递alpha参数:

ss.t.cdf(regression_results.tvalues[0], df)
Out[14]: 0.98548157175089246

99%的置信区间。