生成两个向量之间的差异向量

时间:2013-02-19 04:14:02

标签: r

我有两个csv文件,每个文件都包含一列数据

例如,vecA.csv就像

id
1
2

vecB.csv就像

id
3
2

我按如下方式阅读数据集:

vectorA<-read.table("vecA.csv",sep=",",header=T)
vectorB<-read.table("vecB.csv",sep=",",header=T)

我想生成一个由属于B的元素组成的向量。

2 个答案:

答案 0 :(得分:80)

您正在寻找功能setdiff

setdiff(vectorB$id, vectorA$id)

如果您不希望将此缩减为唯一值,则可以创建not in函数

(感谢@joran Match with negation

'%nin%' <- Negate('%in%')

vectorB$id[vectorB$id %nin% vectorA$id]

答案 1 :(得分:12)

如果你的矢量是data.table s,那么你只需要五个字符:

B[!A]

library(data.table)

# read in your data, wrap in data.table(..., key="id") 
A <- data.table(read.table("vecA.csv",sep=",",header=T), key="id")
B <- data.table(read.table("vecB.csv",sep=",",header=T), key="id")

# Then this is all you need
B[!A]

[Matthew]在v1.8.7中,读取文件也更简单快捷:

A <- setkey(fread("vecA.csv"), id)
B <- setkey(fread("vecB.csv"), id)
B[!A]