假设我想预测因变量D
,其中:
D<-rnorm(100)
我无法观察D,但我知道三个预测变量的值:
I1<-D+rnorm(100,0,10)
I2<-D+rnorm(100,0,30)
I3<-D+rnorm(100,0,50)
我想通过使用以下回归方程预测D:
I1 * w1 + I2 * w2 + I3 * w3 = ~D
但是,我不知道权重的正确值(w
),但我想通过重复估算来对它们进行微调:
在第一步中我使用相同的权重:
w1= .33
,w2=.33
,w3=.33
我使用这些权重估算D
:
EST= I1 * .33 + I2 * .33 + I3 *. 33
我收到反馈,这是D
与我的估算(diff=D-EST
)之间的差异分数
我使用此反馈修改原始权重并对其进行微调,以最终最小化D
和EST
之间的差异。
我的问题是:
差异分数是否足以能够微调权重?
手动微调重量有哪些方法? (例如,我可以查看diff
和I1,I2,I3
之间的相关性,并将其用作权重吗?
答案 0 :(得分:0)
以下命令
coefficients(lm(D ~ I1 + I2 + I3))
会为您提供理想的权重,以最大限度地减少diff
。
由于无法隔离每个diff
的错误组件,您定义的I
将无法正确地手动操作权重。
D
和I
之间的相关性是不够的,因为它只告诉你预测器的强度,而不是重量。如果你的I
是真正独立的(彼此之间,所有在一起,而且是D
- 一个强有力的假设,但对于每个人使用rnorm
时都是如此),你可以尝试操纵一个一次并注意它如何影响diff
,但使用线性回归模型是最简单的方法。