我需要合并几个不同的数据框。
一方面,我有几个带有元数据A
的数据帧,另一方面,还有各自的信息B
。
A.
[1] "LOJun_Meta" "LOMay_Meta" "VOJul_Meta" "VOJun_Meta" "VOMay_Meta" "ZOJun_Meta"
[7] "ZOMay_Meta"
B.
[1] "LOJun_All." "LOMay_all." "VOJul_All." "VOJun_all." "VOMay_all." "ZOJun_all."
[7] "ZOMay_all."
数据帧的名称已采用列表格式(即list1
和list2
),并且数据帧已导入R中。
我的目标是创建一个循环,将合并dplyr > left-join
各自的数据帧。例如:
LOJun_Meta + LOJun_All; LoMay_Meta + LOJun_all etc...
我遇到的麻烦是创建一个循环,该循环将“同步”“合并”过程。
我不确定是否应该创建一个具有两个输入并进行“合并”的函数。
那会是
merging(list1, list2){
for i in length(list):
left_join(list1[i], list[2], by = c("PrimaryKey" = "ForeignKey"))
}
我认为问题在于函数应该引用的数据帧不是list1 & list2
值,而是存储在list1 & list2
中的数据帧名称。
有什么想法吗?
非常感谢!干杯
下面是我要实现的目标图:
[循环图-dplyr /多个数据帧1
我热衷于自动化的一个例子就是这个动作:
ZOMay<- left_join(ZOMay_Meta, ZOMay_all., by = c("Primary Key" = "Foreign key"))
ZOJun<- left_join(ZOJun_Meta, ZOJun_all., by = c("Primary Key" = "Foreign Key"))
write.csv(ZOMay, file = "ZOMay_Consolidated.csv")
write.csv(ZOMay, file = "ZOJun_Consolidated.csv")
答案 0 :(得分:1)
以下是如何为您的情况构建可复制示例的示例:
library(tidyverse)
df1a <- data_frame(id = 1:3, var1 = LETTERS[1:3])
df2a <- data_frame(id = 1:3, var1 = LETTERS[4:6])
df1b <- data_frame(id = 1:3, var2 = LETTERS[7:9])
df2b <- data_frame(id = 1:3, var2 = LETTERS[10:12])
list1 <- list(df1a, df2a)
list2 <- list(df1b, df2b)
现在,据我所知,您想为left_join
和df1a
以及df1b
和df2a
做一个df2b
。可以使用map2
包中的purrr
来代替循环。这将遍历两个列表,并将函数应用于每对元素。
map2(list1, list2, left_join)
# [[1]]
# # A tibble: 3 x 3
# id var1 var2
# <int> <chr> <chr>
# 1 1 A G
# 2 2 B H
# 3 3 C I
#
# [[2]]
# # A tibble: 3 x 3
# id var1 var2
# <int> <chr> <chr>
# 1 1 D J
# 2 2 E K
# 3 3 F L