我有两个csv文件,每个文件都包含一列数据
例如,vecA.csv就像
id
1
2
vecB.csv就像
id
3
2
我按如下方式阅读数据集:
vectorA<-read.table("vecA.csv",sep=",",header=T)
vectorB<-read.table("vecB.csv",sep=",",header=T)
我想生成一个由属于B的元素组成的向量。
答案 0 :(得分:80)
您正在寻找功能setdiff
setdiff(vectorB$id, vectorA$id)
如果您不希望将此缩减为唯一值,则可以创建not in
函数
(感谢@joran Match with negation)
'%nin%' <- Negate('%in%')
vectorB$id[vectorB$id %nin% vectorA$id]
答案 1 :(得分:12)
如果你的矢量是data.table
s,那么你只需要五个字符:
B[!A]
library(data.table)
# read in your data, wrap in data.table(..., key="id")
A <- data.table(read.table("vecA.csv",sep=",",header=T), key="id")
B <- data.table(read.table("vecB.csv",sep=",",header=T), key="id")
# Then this is all you need
B[!A]
[Matthew]在v1.8.7中,读取文件也更简单快捷:
A <- setkey(fread("vecA.csv"), id)
B <- setkey(fread("vecB.csv"), id)
B[!A]