我应该如何将状态N作为权重变量?

时间:2016-02-06 02:36:41

标签: linear-regression spss weighted

我的数据结构是:

State           N           Var1            Var2
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65

Var1Var2是州级别的汇总百分比值。 N是每个州的参与人数。我想在Var1Var2之间进行线性回归,并考虑N作为权重,在SPSS中执行此操作的最佳方式是什么?

2 个答案:

答案 0 :(得分:2)

您可以使用WEIGHT BY或使用REGRESSION上的子命令 - 以下示例。

DATA LIST FREE / State (A15) N  Var1  Var2 (3F2.0).
BEGIN DATA
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65
END DATA.

WEIGHT BY N.
REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

*Or using subcommand.
WEIGHT OFF.    
REGRESSION
  /MISSING LISTWISE
  /REGWGT=N
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

您可以亲眼看到这两个程序产生相同的估算值。如果您在没有加权或使用REGWGT子命令的情况下运行回归,则会对此示例产生不同的估计值。

答案 1 :(得分:0)

使用N作为重量的原因是什么?如果你想这样做,因为回归认为权重是一个复制权重,你需要注意你的自由度。