我想在R中进行交叉连接。如果我们没有条件,那么data.table
包就可以了。但是在R?
Select table1.value as value1, table2.value as value2
from table1 cross join table2 where table1.id = table2.id
考虑这个例子
table1:
id value
1 1
1 2
2 1
3 1
3 3
3 4
table2:
id value
1 5
1 4
2 1
3 4
3 3
在这种情况下,我想要的输出是:
value1 value2
1 5
1 4
2 5
2 4
1 1
1 4
1 3
3 4
3 3
4 4
4 3
请注意,id列既不是唯一的,也不是结果集具有唯一的行。
答案 0 :(得分:4)
列value.x和value.y是您需要的
table1 <- data.frame(id= c(1,1,2,3,3,3), value=c(1,2,1,1,3,4))
table2 <- data.frame(id=c(1,1,2,3,3), value=c(5,4,1,4,3))
merge(table1,table2,by="id",all.y=TRUE)
id value.x value.y
1 1 1 5
2 1 1 4
3 1 2 5
4 1 2 4
5 2 1 1
6 3 1 4
7 3 1 3
8 3 3 4
9 3 3 3
10 3 4 4
11 3 4 3
答案 1 :(得分:1)
您无法按定义交叉连接索引,也不能在R术语中交叉连接。你上面的内容是内部联接。
library(dplyr)
table1 %>% select(table1.value = value, id) %>%
inner_join(table2 %>% select(table2.value = value, id))
如果你想要的是能够同时交叉连接和过滤,你可能需要查看data.table,因为它们不能在dplyr中组合。
table1 %>% select(table1.value = value, table1.id = id) %>%
merge(table2 %>% select(table2.value = value, table2.id = id)) %>%
filter(table1.id == table2.id)