我有两个数据帧:
df1 <- data.frame( pt = c("pt1153", "pt1153", "pt1153", "pt1154", "pt1155", "pt1156"),
phys = c("p10", "p616", "p850", "p899", "p709", "p892"))
df2<- data.frame( sender = c("p10", "p10", "p100", "p100", "p102", "p103"),
s.type = c(11,11,21,21,11, 21),
receiver = c("p616", "p850", "p235", "p388", "p596", "p696"),
r.type = c(21,31,11,11,31,31),
shared.pts = c(1,1,1,1,1,1) )
我想以
结束 sender s.type receiver r.type shared.pts pts
p10 11 p616 21 1 p1153
p10 11 p850 31 1 p1153
但我无法弄明白该怎么做。我尝试合并然后使用ddply,但这不起作用。我也尝试过使用apply,但无法弄清楚要做什么功能。
仅合并dfs是不够的。我需要根据每个共享df1
中“pts”列的成员来合并它们虽然我似乎无法重现我的问题,但当我使用合并时,我最终得到:
p.sender.id p.receiver.type Source.total.pts p.receiver.id p.sender.type Target.total.pts shared.pts patient.id
1 p10 21 6 p616 11 3 1 pt2439
2 p10 21 6 p616 11 3 1 pt1870
3 p10 21 6 p616 11 3 1 pt1153
4 p10 21 6 p616 11 3 1 pt64
5 p10 21 6 p616 11 3 1 pt1626
6 p10 21 6 p616 11 3 1 pt941
7 p10 31 6 p850 11 10 1 pt2439
8 p10 31 6 p850 11 10 1 pt1870
9 p10 31 6 p850 11 10 1 pt1153
10 p10 31 6 p850 11 10 1 pt64
当p10和p616只共享一个pt时。 pt1153
答案 0 :(得分:2)
我认为合并应该有效!!
merge(df2, df1, by.x = "sender", by.y = "p")
sender receiver pts
1 p10 p850 pt800
2 p55 p90 pt11
答案 1 :(得分:1)
这可以让你大部分时间,只有列的顺序不同:
ddply(df1,.(pts),function(x){ x$p })
pts V1 V2
1 pt11 p55 p90
2 pt800 p10 p850
但是因为我只使用了df1
,所以我怀疑你是否遗漏了任何问题,这意味着你不能将这个策略用于你的真实数据。