Question

我有一个数据集，每个案例都是学生，我有一个性别变量（SEX），还有一个主要变量（MAJOR）。性别的变量有两个可能的值（男性和女性），而主要的变量有几十个（生物学，数学等）。

我想使用该数据集创建另一个数据集，每个主要的一个案例和3个变量：MAJOR，MALE和FEMALE。每个专业的变量MALE的值应该是在该专业中注册的男性的数量，变量FEMALE的值应该是在其中注册的女性的数量。 MAJOR的值应该只是与该案例对应的原始数据集中变量MAJOR的值的标签。

就这么清楚，当我查看我想要创建的数据集时，每个专业应该有一行，一列MAJOR包含每个专业的标签，一个用于MALE，包含每个专业注册的男性人数和女性的一列，其中包含每个专业的女性人数。

我拥有的数据集是使用SPSS创建的，我从未使用过该程序，因此我不知道如何做到这一点，即使它可能非常简单。我非常感谢你的帮助！

最佳，菲利普

Answer 1

当您的文件打开时，打开一个新的语法窗口，将以下代码放入其中并运行它：

dataset name OrigFile.
compute male=(SEX="MALE").
compute female=(SEX="FEMALE").
dataset declare NewFile.
aggregate /outfile='NewFile' /break=major /male female=sum(male female).

运行此项后，您将拥有两个打开的数据集 - 原始数据集和您要创建的新数据集。

为原始数据集中的每个变量值创建一个包含一个案例的新数据集

1 个答案: