基于与数据帧的比较从列表中进行R子集化

时间:2015-06-15 19:14:06

标签: r list merge dataframe

我有一个包含一系列加载文件的列表。我希望将此列表子集化,以获得与另一个数据框中的值匹配的每个文件的结果。

例如,使用以下测试代码:

data.coords1 <- c(1,6,7,9,18)
data.lett1 <- c("T","T","G","C","T")

data1 <- cbind(data.coords1, data.lett1)

data.coords2 <- c(2,4,19,20)
data.lett2 <- c("G","T","G","C")

data2 <- cbind(data.coords2, data.lett2)

data.coords3 <- c(10,11,12,13,15,17)
data.lett3 <- c("C","T","C","C","T","G")

data3 <- cbind(data.coords3, data.lett3)

data.list <- list(data1, data2, data3)

ref.coords <- c(1:20)
ref.mark <- letters[1:20]
ref.MARK <- LETTERS[1:20]

ref <- cbind(ref.coords, ref.mark, ref.MARK)

我可以通过以下方式获得我想要的(对于一个列表元素)

desired.data <- merge(data2,ref, by.x="data.coords1",
                       by.y="ref.coords", sort=F)

但是我怎样才能轻松地为整个清单做到这一点?

1 个答案:

答案 0 :(得分:1)

lapply(1:length(data.list), function(i) merge(data.list[[i]],ref, by.x=paste0("data.coords",i), by.y="ref.coords", sort=F))
[[1]]
  data.coords1 data.lett1 ref.mark ref.MARK
1            1          T        a        A
2            6          T        f        F
3            7          G        g        G
4            9          C        i        I
5           18          T        r        R

[[2]]
  data.coords2 data.lett2 ref.mark ref.MARK
1            2          G        b        B
2            4          T        d        D
3           19          G        s        S
4           20          C        t        T

[[3]]
  data.coords3 data.lett3 ref.mark ref.MARK
1           10          C        j        J
2           11          T        k        K
3           12          C        l        L
4           13          C        m        M
5           15          T        o        O
6           17          G        q        Q