我有一个大约800K ID的向量,我想检查它是否是其他两个大向量之一的一部分," active"和"取消",每个都有大约100万条记录。我怎样才能做到这一点?显然循环800K ID并执行%in%检查" active"并且"取消"向量将永远存在......有更快的方法吗?
我的目标是为每个800K ID提供列表(如果它们处于活动状态或已取消),并获得以下内容:
ID Active Cancelled
123 1 0
124 1 0
...
答案 0 :(得分:0)
如果你正在处理向量,你应该给intersect
函数一个镜头......这基本上只是一个包裹的%in%
,但不过......