我有一个包含xnumber命名元素的列表,每个元素都包含一系列数字。
我还有一个包含2列的data.frame:
我希望快速确定列表元素中每行data.frame值的位置,因为list元素等于data.frame中每个给定的data.frame row的值#s名称列。
最终目标实际上是生成一个向量,其中包含我在data.frame的每一行匹配的值之前的每个适当元素的列表值。
我的数据有200,000行,所以我试图优化这个过程。
示例
我有一个列表和data.frame:
a = 1:5; b = 6:10; c = 4:8; l1 <- list(a,b,c) # a list
d1 <- data.frame(name = c('c','a','b'), val = c(7,3,8)) #a data.frame
首先,我想知道列表中每个值的出现位置(以便元素与data.frame中同一行的名称匹配):
where <- ????
>where
[1] 4 3 3 # 7 = 4th number in c, 3 = 3rd # in a, and 8 = 3rd # in b
但最终我希望输出显示我匹配前的元素中的值:
which <- ????
>which
[1] 6 2 7
答案 0 :(得分:5)
要获得包含命名项的列表,可以使用以下语法:
l1 <- list(a=a,b=b,c=c)
然后您可以使用mapply()
来测试每个项目:
mapply(function(n,v) which(l1[[n]]==v) , d1$name,d1$val)
[1] 4 3 3
然后再次mapply()
获取值:
mapply(function(n,i) l1[[ n]][i] , d1$name,
mapply(function(n,v) which(l1[[n]]==v)-1 , d1$name,d1$val))
[1] 6 2 7