Question

我有这个问题。我正在尝试进行线性回归并测试斜率。 t检验检查斜率是否远离0.斜率可以是负的或正的。我只对负斜率感兴趣。

在这个例子中，斜率为正，我不感兴趣，因此P值应该很大。但它很小，因为现在它测试斜率是否远离0，在任何一个方向。（我强迫拦截零，这就是我想要的）。有人可以帮助我使用语法来查看斜率是否只是负数。在这种情况下，P值应该很大。

我怎样才能改变，说99％的置信水平或95％或......？

import statsmodels.api as sm
import matplotlib.pyplot as plt
import numpy
X = [-0.013459134, 0.01551033, 0.007354476, 0.014686473, -0.014274754, 0.007728445, -0.003034186, -0.007409397]
Y = [-0.010202462, 0.003297546, -0.001406498, 0.004377665, -0.009244517, 0.002136552, 0.006877126, -0.001494624]
regression_results = sm.OLS (Y, X, missing = "drop").fit ()
P_value = regression_results.pvalues [0]
R_squared = regression_results.rsquared
K_slope = regression_results.params [0]
conf_int = regression_results.conf_int ()
low_conf_int = conf_int [0][0]
high_conf_int = conf_int [0][1]
fig, ax = plt.subplots ()
ax.grid (True)
ax.scatter (X, Y, alpha = 1, color='orchid')
x_pred = numpy.linspace (min (X), max (X), 40)
y_pred = regression_results.predict (x_pred)
ax.plot (x_pred, y_pred, '-', color='darkorchid', linewidth=2)

Answer 1

双向t检验的p值由下式计算：

message_id

您的修改只会是：

import scipy.stats as ss
df = regression_results.df_resid
ss.t.sf(regression_results.tvalues[0], df) * 2 # About the same as (1 - cdf) * 2.
# see @user333700's comment
Out[12]: 0.02903685649821508

因为你只对左尾感兴趣。

对于置信区间，您只需传递alpha参数：

ss.t.cdf(regression_results.tvalues[0], df)
Out[14]: 0.98548157175089246

99％的置信区间。

线性回归的单侧t检验？

1 个答案: