为原始数据集中的每个变量值创建一个包含一个案例的新数据集

时间:2017-06-14 00:15:04

标签: spss

我有一个数据集,每个案例都是学生,我有一个性别变量(SEX),还有一个主要变量(MAJOR)。性别的变量有两个可能的值(男性和女性),而主要的变量有几十个(生物学,数学等)。

我想使用该数据集创建另一个数据集,每个主要的一个案例和3个变量:MAJOR,MALE和FEMALE。每个专业的变量MALE的值应该是在该专业中注册的男性的数量,变量FEMALE的值应该是在其中注册的女性的数量。 MAJOR的值应该只是与该案例对应的原始数据集中变量MAJOR的值的标签。

就这么清楚,当我查看我想要创建的数据集时,每个专业应该有一行,一列MAJOR包含每个专业的标签,一个用于MALE,包含每个专业注册的男性人数和女性的一列,其中包含每个专业的女性人数。

我拥有的数据集是使用SPSS创建的,我从未使用过该程序,因此我不知道如何做到这一点,即使它可能非常简单。我非常感谢你的帮助!

最佳, 菲利普

1 个答案:

答案 0 :(得分:2)

当您的文件打开时,打开一个新的语法窗口,将以下代码放入其中并运行它:

dataset name OrigFile.
compute male=(SEX="MALE").
compute female=(SEX="FEMALE").
dataset declare NewFile.
aggregate /outfile='NewFile' /break=major /male female=sum(male female).

运行此项后,您将拥有两个打开的数据集 - 原始数据集和您要创建的新数据集。