我不是专家统计员,但我目前是介绍性统计课程的讲师,该课程在每周一次的计算机实验教程中使用SPSS 24。
在今天上午的实验室里,我向实验室的20多名学生分发了一个数据文件。该数据文件包含50,000多个案例;我指示他们获取500个案例的随机样本,然后回答有关它的各种问题。 (这个想法是每个学生都有自己的样本。)为了获得他们的样本,我按照这里的说明进行了操作:http://commfaculty.fullerton.edu/jreinard/bookweb/random.htm
然而,很明显,有几个学生会获得相同的数据样本 - 这表明样本并不像我希望的那样随意。 (当我之前使用Minitab教授相同的课程时,我没有遇到这个问题。)我需要告诉学生他们是否可以获得实际随机的样本?
答案 0 :(得分:1)
我会指示学生将输出粘贴到新的语法窗口,而不是仅仅通过GUI。您无法真正诊断GUI的问题,因为学生不太可能记住他们采取的确切步骤。
结束代码应该是:
SAMPLE 500 FROM 50000.
如果您希望学生完全 500个案例。
现在可能会让您的学生选择相同的样本?一个简单的方法是,如果他们将从选项指定为仅为500,例如SAMPLE 500 FROM 500
。这根本不是随机样本,只是在数据集中选择第一个 500个案例。
如果您希望学生拥有完全相同的样本,您可以设置种子,例如:
SET SEED 10.
SAMPLE 500 FROM 50000.
这显示了如何重现他们的结果。 (所以这在技术上可能会产生相同的样本,但我不认为种子是相同的,或者学生将其设置为相同可能是一种解释。)
答案 1 :(得分:0)
问题似乎是由于在选择样本之前未在随机数生成器中设置种子。 (根据我在其他软件包中使用“随机”命令的经验,我没想到要这么做。)
在GUI中,选择“变换”和“随机数生成器”,然后选择“设置起始点”并输入一些数字作为“固定值”。一位同事建议,如果每个学生都使用自己的学生证号码,这会给出不同的种子和不同的随机样本。