使用SPSS获取随机样本

时间:2017-09-19 14:51:37

标签: spss

我不是专家统计员,但我目前是介绍性统计课程的讲师,该课程在每周一次的计算机实验教程中使用SPSS 24。

在今天上午的实验室里,我向实验室的20多名学生分发了一个数据文件。该数据文件包含50,000多个案例;我指示他们获取500个案例的随机样本,然后回答有关它的各种问题。 (这个想法是每个学生都有自己的样本。)为了获得他们的样本,我按照这里的说明进行了操作:http://commfaculty.fullerton.edu/jreinard/bookweb/random.htm

然而,很明显,有几个学生会获得相同的数据样本 - 这表明样本并不像我希望的那样随意。 (当我之前使用Minitab教授相同的课程时,我没有遇到这个问题。)我需要告诉学生他们是否可以获得实际随机的样本?

2 个答案:

答案 0 :(得分:1)

我会指示学生将输出粘贴到新的语法窗口,而不是仅仅通过GUI。您无法真正诊断GUI的问题,因为学生不太可能记住他们采取的确切步骤。

结束代码应该是:

SAMPLE 500 FROM 50000.

如果您希望学生完全 500个案例。

现在可能会让您的学生选择相同的样本?一个简单的方法是,如果他们将选项指定为仅为500,例如SAMPLE 500 FROM 500。这根本不是随机样本,只是在数据集中选择第一个 500个案例。

如果您希望学生拥有完全相同的样本,您可以设置种子,例如:

SET SEED 10.
SAMPLE 500 FROM 50000.

这显示了如何重现他们的结果。 (所以这在技术上可能会产生相同的样本,但我不认为种子是相同的,或者学生将其设置为相同可能是一种解释。)

答案 1 :(得分:0)

问题似乎是由于在选择样本之前未在随机数生成器中设置种子。 (根据我在其他软件包中使用“随机”命令的经验,我没想到要这么做。)

在GUI中,选择“变换”和“随机数生成器”,然后选择“设置起始点”并输入一些数字作为“固定值”。一位同事建议,如果每个学生都使用自己的学生证号码,这会给出不同的种子和不同的随机样本。