我有一个非常大的(949,000个障碍物)堆叠(长形式)数据集。我想根据一个变量中是否存在数据来选择案例,但保留该唯一ID的其他堆叠数据。这有意义吗?
你有什么想法吗?
答案 0 :(得分:0)
你当然可以在统计学中这样做。使用AGGREGATE将person id作为break变量,例如,将mean作为摘要统计量。选择将聚合统计添加到案例中。然后选择那些不会丢失聚合的情况。
答案 1 :(得分:-1)
SPSS是统计数据的应用程序包,不是编程语言。我会使用stackoverflow系列的另一个成员。
尝试交叉验证(https://stats.stackexchange.com/)