我有这个问题。我正在尝试进行线性回归并测试斜率。 t检验检查斜率是否远离0.斜率可以是负的或正的。我只对负斜率感兴趣。
在这个例子中,斜率为正,我不感兴趣,因此P值应该很大。但它很小,因为现在它测试斜率是否远离0,在任何一个方向。 (我强迫拦截零,这就是我想要的)。有人可以帮助我使用语法来查看斜率是否只是负数。在这种情况下,P值应该很大。
我怎样才能改变,说99%的置信水平或95%或......?
import statsmodels.api as sm
import matplotlib.pyplot as plt
import numpy
X = [-0.013459134, 0.01551033, 0.007354476, 0.014686473, -0.014274754, 0.007728445, -0.003034186, -0.007409397]
Y = [-0.010202462, 0.003297546, -0.001406498, 0.004377665, -0.009244517, 0.002136552, 0.006877126, -0.001494624]
regression_results = sm.OLS (Y, X, missing = "drop").fit ()
P_value = regression_results.pvalues [0]
R_squared = regression_results.rsquared
K_slope = regression_results.params [0]
conf_int = regression_results.conf_int ()
low_conf_int = conf_int [0][0]
high_conf_int = conf_int [0][1]
fig, ax = plt.subplots ()
ax.grid (True)
ax.scatter (X, Y, alpha = 1, color='orchid')
x_pred = numpy.linspace (min (X), max (X), 40)
y_pred = regression_results.predict (x_pred)
ax.plot (x_pred, y_pred, '-', color='darkorchid', linewidth=2)
答案 0 :(得分:3)
双向t检验的p值由下式计算:
message_id
您的修改只会是:
import scipy.stats as ss
df = regression_results.df_resid
ss.t.sf(regression_results.tvalues[0], df) * 2 # About the same as (1 - cdf) * 2.
# see @user333700's comment
Out[12]: 0.02903685649821508
因为你只对左尾感兴趣。
对于置信区间,您只需传递alpha参数:
ss.t.cdf(regression_results.tvalues[0], df)
Out[14]: 0.98548157175089246
99%的置信区间。