在我的数据文件中,我通过Select Cases选择固定大小的随机样本。 假设我有400个案例,我随机选择150个案例。所有案例都有AGE和SEX值。 我现在想测试样本的AGE和SEX分布(150例)与AGE和SEX分布的其余部分(250例)并检查我的样本是否代表人口。
我的解决方案是计算两个新变量,我根据样本或休息值将值放入其中。这里适合年龄:
IF (filter_$ EQ 1) sample_age = age.
IF (filter_$ EQ 0) rest_age = age.
EXECUTE .
如何在sample_age和rest_age上执行测试? 哪种测试合适?
数据如下所示:
person sample_age rest_age
1 29 .
2 56 .
3 . 34
4 . 12
5 65 .
答案 0 :(得分:1)
您不应该使用缺失值创建新变量。假设您已经计算了标识单独样本的filter_$
变量,对于连续年龄变量,您可以估计独立样本t检验。
T-TEST GROUPS = filter_$ (1 0)
/VARIABLES=age.
对于绝对性,您可以运行CROSSTABS
并计算卡方统计量。
CROSSTABS
/TABLES = filter_$ BY sex
/STATISTICS=CHISQ.