使用R在几个向量中找到共同元素并应用函数

时间:2013-05-14 08:40:09

标签: r

我是R新手,我想提出一个问题,虽然标题与其他已发布的问题类似但我没有找到解决方案。

我的问题如下:我有几个不同长度的向量,我想以成对的方式比较它们并将一个函数应用于每个比较,以生成向量之间的公共元素的值,例如4个名为A的向量,B,C,DI想要找到A和B,A和C,A和D,B和C,B和D,C和D之间的共同元素。

这里有一个更详细的例子(只有两个向量):

A=c("t","qt","er","oa","qra")
B=c("t","ea","ew","ee","oa","qwt") 
length(which(A%in%B))/min(length(A),length(B)) #this is the function I would like to apply to each comparison.
0.4 #value returned for the function

我有大量的向量,我不知道如何实现for循环以进行成对比较。

非常感谢提前

1 个答案:

答案 0 :(得分:4)

您可以使用outer

baseSet <- c('t','qt','er','oa','qra','ea','ew','ee','qwt')
set.seed(0)
A <- sample(baseSet, 5)
B <- sample(baseSet, 5)
C <- sample(baseSet, 5)
D <- sample(baseSet, 5)
dFun <- function(x,y){length(which(x%in%y))/min(length(x),length(y))}

outer(list(A,B,C,D), list(A,B,C,D),Vectorize(dFun))
#     [,1] [,2] [,3] [,4]
#[1,]  1.0  0.6  0.2  0.6
#[2,]  0.6  1.0  0.4  0.6
#[3,]  0.2  0.4  1.0  0.4
#[4,]  0.6  0.6  0.4  1.0

编辑:

list.df <- list(A=A, B=B, C=C, D=D)
outer(list.df, list.df, Vectorize(dFun))
#    A   B   C   D
#A 1.0 0.6 0.2 0.6
#B 0.6 1.0 0.4 0.6
#C 0.2 0.4 1.0 0.4
#D 0.6 0.6 0.4 1.0