Question

我的数据结构是：

State           N           Var1            Var2
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65

Var1和Var2是州级别的汇总百分比值。 N是每个州的参与人数。我想在Var1和Var2之间进行线性回归，并考虑N作为权重，在SPSS中执行此操作的最佳方式是什么？

Answer 1

您可以使用WEIGHT BY或使用REGRESSION上的子命令 - 以下示例。

DATA LIST FREE / State (A15) N  Var1  Var2 (3F2.0).
BEGIN DATA
Alabama         23          54              42
Alaska          4           53              53
Arizona         53          75              65
END DATA.

WEIGHT BY N.
REGRESSION
  /MISSING LISTWISE
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

*Or using subcommand.
WEIGHT OFF.    
REGRESSION
  /MISSING LISTWISE
  /REGWGT=N
  /STATISTICS COEFF OUTS R ANOVA
  /CRITERIA=PIN(.05) POUT(.10)
  /NOORIGIN 
  /DEPENDENT Var1
  /METHOD=ENTER Var2.

您可以亲眼看到这两个程序产生相同的估算值。如果您在没有加权或使用REGWGT子命令的情况下运行回归，则会对此示例产生不同的估计值。

Answer 2

使用N作为重量的原因是什么？如果你想这样做，因为回归认为权重是一个复制权重，你需要注意你的自由度。

我应该如何将状态N作为权重变量？

2 个答案: