我对优化数据集有疑问。随着时间的推移,我有大约5000个人的数据集(大约有50个变量)。但是我有重复的情况...例如:ID:1年:1 ID:1年:2 ID:1年2.因此,为了确保没有双年,我使用casestovar不丢失数据。
然而,我没有使用带有索引的casestovar我有很多变量。我必须更改这些变量,以便当我用varstocases恢复数据集时,我不再有这么多年了!
我该怎么做?
(额外信息:我做了casestovars,所以我没有丢失信息,因为重复的案例只是部分相同(有些变量不是))。
亲切的问候,
本能