SPSS - 将文件与ID变量和新案例/变量的重复案例合并

时间:2017-02-20 19:02:53

标签: merge duplicates spss

我有一个多年来商店访问的管理数据集,我试图在ID变量下合并为一个。

每个数据集都有ID的副本,这些副本在不同的商店访问期间发生,由Date注释。一些较新的数据文件还具有未包含在旧数据文件中的新变量(Y)。来自不同年份的数据集还将包含由不同年份ID指示的不同情况。此外,对于每种情况,但在不同日期,一些变量可能相同。我希望合并的文件保留这些重复项。

示例数据文件:

档案1

ID Date X
1  3    4
1  5    3
2  1    4

文件2

ID Date X  Y
1  6    4  2
1  7    1  5
2  8    4  7
3  7    2  3

我希望合并文件继续列出所有重复的案例,如下:

ID Date X  Y
1  3    4  .
1  5    3  .
1  6    4  2
1  7    1  5
2  1    4  .
2  8    4  7
3  7    2  3

然后我计划重组(CASESTOVARS /AUTOFIX=0)合并的文件,使它看起来像这样:

ID Date.1 Date.2 Date.3 Date.4  X.1  X.2  X.3  X.4  Y.1  Y.2  Y.3  Y.4
1  3      5      6      7       4    3    4    1    .    .    2    5
2  1      8      .      .       4    4    .    .    .    7    .    .
3  7      .      .      .       2    .    .    .    3    .    .    .

然而,我在初始合并过程中遇到了麻烦。我已经尝试查找合并文件的最安全的方法,当它们都有重复的情况时,以确保过程中没有数据丢失。似乎"添加变量"方法导致重复变量的值丢失。

谢谢!

编辑:如果我使用"添加变量"函数并使用IDDate变量作为关键变量,这有助于避免删除重复的案例吗?

1 个答案:

答案 0 :(得分:2)

为什么不试试add cases而不是add variables?如果没有出现具有相同日期的相同Id,则它应该与casestovars一起正常工作。

如果存在此类情况,您需要先考虑要对其进行操作,然后才能继续casestovars。 一种方法是按ID和DATE进行汇总,并决定是否要例如为这种情况添加数据变量。