Question

在我的数据文件中，我通过Select Cases选择固定大小的随机样本。假设我有400个案例，我随机选择150个案例。所有案例都有AGE和SEX值。我现在想测试样本的AGE和SEX分布（150例）与AGE和SEX分布的其余部分（250例）并检查我的样本是否代表人口。

我的解决方案是计算两个新变量，我根据样本或休息值将值放入其中。这里适合年龄：

IF (filter_$ EQ 1) sample_age = age.
IF (filter_$ EQ 0) rest_age = age.
EXECUTE .

如何在sample_age和rest_age上执行测试？哪种测试合适？

数据如下所示：

person    sample_age    rest_age
1                 29           .
2                 56           .
3                  .          34
4                  .          12
5                 65           .

Answer 1

您不应该使用缺失值创建新变量。假设您已经计算了标识单独样本的filter_$变量，对于连续年龄变量，您可以估计独立样本t检验。

T-TEST GROUPS = filter_$ (1 0)
  /VARIABLES=age.

对于绝对性，您可以运行CROSSTABS并计算卡方统计量。

CROSSTABS 
  /TABLES = filter_$ BY sex 
  /STATISTICS=CHISQ.

将人口分成样本并休息并执行分布测试（SPSS）

1 个答案: