我有一个多年来商店访问的管理数据集,我试图在ID
变量下合并为一个。
每个数据集都有ID
的副本,这些副本在不同的商店访问期间发生,由Date
注释。一些较新的数据文件还具有未包含在旧数据文件中的新变量(Y
)。来自不同年份的数据集还将包含由不同年份ID
指示的不同情况。此外,对于每种情况,但在不同日期,一些变量可能相同。我希望合并的文件保留这些重复项。
示例数据文件:
档案1
ID Date X
1 3 4
1 5 3
2 1 4
文件2
ID Date X Y
1 6 4 2
1 7 1 5
2 8 4 7
3 7 2 3
我希望合并文件继续列出所有重复的案例,如下:
ID Date X Y
1 3 4 .
1 5 3 .
1 6 4 2
1 7 1 5
2 1 4 .
2 8 4 7
3 7 2 3
然后我计划重组(CASESTOVARS /AUTOFIX=0
)合并的文件,使它看起来像这样:
ID Date.1 Date.2 Date.3 Date.4 X.1 X.2 X.3 X.4 Y.1 Y.2 Y.3 Y.4
1 3 5 6 7 4 3 4 1 . . 2 5
2 1 8 . . 4 4 . . . 7 . .
3 7 . . . 2 . . . 3 . . .
然而,我在初始合并过程中遇到了麻烦。我已经尝试查找合并文件的最安全的方法,当它们都有重复的情况时,以确保过程中没有数据丢失。似乎"添加变量"方法导致重复变量的值丢失。
谢谢!
编辑:如果我使用"添加变量"函数并使用ID
和Date
变量作为关键变量,这有助于避免删除重复的案例吗?
答案 0 :(得分:2)
为什么不试试add cases
而不是add variables
?如果没有出现具有相同日期的相同Id,则它应该与casestovars
一起正常工作。
如果存在此类情况,您需要先考虑要对其进行操作,然后才能继续casestovars
。
一种方法是按ID和DATE进行汇总,并决定是否要例如为这种情况添加数据变量。