我的数据结构是:
State N Var1 Var2
Alabama 23 54 42
Alaska 4 53 53
Arizona 53 75 65
Var1
和Var2
是州级别的汇总百分比值。 N
是每个州的参与人数。我想在Var1
和Var2
之间进行线性回归,并考虑N
作为权重,在SPSS中执行此操作的最佳方式是什么?
答案 0 :(得分:2)
您可以使用WEIGHT BY
或使用REGRESSION
上的子命令 - 以下示例。
DATA LIST FREE / State (A15) N Var1 Var2 (3F2.0).
BEGIN DATA
Alabama 23 54 42
Alaska 4 53 53
Arizona 53 75 65
END DATA.
WEIGHT BY N.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Var1
/METHOD=ENTER Var2.
*Or using subcommand.
WEIGHT OFF.
REGRESSION
/MISSING LISTWISE
/REGWGT=N
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Var1
/METHOD=ENTER Var2.
您可以亲眼看到这两个程序产生相同的估算值。如果您在没有加权或使用REGWGT
子命令的情况下运行回归,则会对此示例产生不同的估计值。
答案 1 :(得分:0)
使用N作为重量的原因是什么?如果你想这样做,因为回归认为权重是一个复制权重,你需要注意你的自由度。