在尝试确定多少自变量解释因变量的方差时,我应该采用什么统计技术?
对于进一步的情况-我被要求用Python开发一个模型,以检查预测变量对响应变量的影响程度。我通常专注于出于预测目的而开发模型,但是我不确定从哪里开始。
答案 0 :(得分:0)
我将通过查找具有所有预测变量的模型的R平方(R2)值开始分析,然后在一次迭代地遗漏每个预测变量时确定R平方的变化。这样的分析应淘汰对回归分析影响最小的预测变量,并使您对其余预测变量的影响有个好主意。我通常选择R平方拟合统计量进行分析,因为它通常用于解释模型解释的相关数据方差量,因此我通过使用numpy作为“ R2 = 1.0-(numpy.var(回归错误)/ numpy.var(dependent_data))“