我有一个名为classes的向量,它是使用列表删除的分析的输出。因此,类中包含的案例是整个数据集的一个子集 - 由于数据不完整,某些案例被删除。
选择是一个虚拟变量,与我的数据集中的每个案例一起出现。我的数据的简短示例如下。每次观察都有一个独特的案例ID。
classes <- c(1,2,1,1,1,2,3,3,3,1,1,1,3,3,2,2,2)
selection <- c(1,0,0,0,1,1,1,1,0,0,0,0,0,1,1,1,1,0,0,0,1,1,1,0,1,0)
case <-seq(1,26,1)
我想创建一个新版本的选择(例如,selection2),以便它只包含类中的案例。基本上,我希望两个变量的长度相同,以便进行比较,其中未包含在类中的情况也不包括在selection2中。
我认为这很容易解决,但我花了很多时间无处可去,所以我想我会问。提前谢谢!
答案 0 :(得分:0)
如果它们的长度相同,则缩小版必须具有NA:
> selection2 <- selection
> is.na(selection2) <- !selection2 %in% classes
> selection2
[1] 1 NA NA NA 1 1 1 1 NA NA NA NA NA 1 1 1 1 NA NA NA 1 1 1 NA 1 NA