scipy.stats.linregress中标准错误的定义

时间:2015-07-16 13:23:11

标签: python scipy

我正在使用scipy.stats.linregress函数对某些2D数据进行简单的线性回归,例如:

from scipy import stats
x = [5.05, 6.75, 3.21, 2.66]
y = [1.65, 26.5, -5.93, 7.96]
gradient, intercept, r_value, p_value, std_err = stats.linregress(x,y)

该函数的文档说明std_err是:

  

估算的标准误差

我不确定这意味着什么。这个old answer表示它代表“渐变线的标准错误”,但这个“并不总是此库的行为”。

我可以准确定义此参数的确切含义吗?

2 个答案:

答案 0 :(得分:2)

截至2016年12月,我认为它仍然显示OLS回归线斜率的标准误差。我使用orthogonal distance regression作为scipy包的一部分计算了一些数据集的回归,而the output's sd_beta[1](代表回归线斜率的标准误差)非常类似于由scipy.stats.linregress计算的std_err

答案 1 :(得分:1)

这是统计中的标准衡量标准。有关如何计算它的说明,请参阅wikipedia。不幸的是,stackoverflow似乎没有LaTeX支持,因此在这里写出并解释方程是没有意义的。

基本上,std_err应该为渐变中表示的每个系数赋予一个值。简单来说,std_err可以告诉您数据的拟合程度(更高的值意味着精确度更低)。

stats.stackexchange网站上的其他有用答案是herehere