我正在尝试使用SPSS找到数据库中各种变量的置信区间,我遇到了麻烦。
数据是加权的,因为接受调查的每个人代表总人口的不同部分。例如,我们样本中的一名年轻人可能代表一般人口中的28000名年轻男性。问题是SPSS似乎认为年轻人的数据库条目每个代表28000个测量值,当它们实际上只代表一个时,这使得SPSS认为我们拥有的数据远远超过实际数据。因此,SPSS提供非常低的标准误差估计和非常窄的置信区间。
我尝试通过将每个重量值除以平均重量来解决这个问题。这给出了合理的数字,平均权重为1,但我不确定结果数字是否正确。
我的方法听起来好吗?如果没有,我该怎么办?
我一直在使用Explore命令查找均值和标准错误(以及其他内容),以防万一。
答案 0 :(得分:0)
您需要将权重缩放到实际样本大小,但只有“复杂样本”选项中的过程才能正确计算样本权重。统计中的常规权重变量被视为频率权重。