获取数据框的代码:
rat_all = structure(list(frequency = c(37L, 31L, 14L, 11L, 2L, 3L), isoforms = 8:13,
type = structure(c("rat_all", "rat_all", "rat_all", "rat_all",
"rat_all", "rat_all"), .Dim = c(6L, 1L))), .Names = c("frequency",
"isoforms", "type"), row.names = 8:13, class = "data.frame")
rat_ensembl = structure(list(frequency = c(17L, 8L, 20L), isoforms = 8:10,
type = structure(c("rat_ensembl", "rat_ensembl", "rat_ensembl"
), .Dim = c(3L, 1L))), .Names = c("frequency", "isoforms",
"type"), row.names = 8:10, class = "data.frame")
我有两个数据框:
frequency isoforms type
8 17 8 rat_ensembl
9 8 9 rat_ensembl
10 20 10 rat_ensembl
和
frequency isoforms type
8 37 8 rat_all
9 31 9 rat_all
10 14 10 rat_all
11 11 11 rat_all
12 2 12 rat_all
13 3 13 rat_all
我想将这些组合成一个数据框,但也包含缺失的数据框
isoforms
数据框中显示的rat_all
条目,但不显示rat_ensembl
数据框。所以我希望输出是一个组合数据帧,好像我已经组合了一样
这两个数据框,但增加了:
11 0 11 rat_ensembl
12 0 12 rat_ensembl
13 0 13 rat_ensembl
我以为我可以通过合并做到这一点但我最终得到一个很大的混乱,我必须放松,我最终可以按摩到正确的格式,但它不是一个很好的解决方案,如果 我想一次为四种或五种不同的“类型”做这件事。我错过了什么?谢谢!
要明确我希望获得一个看起来像这样的最终数据框:
frequency isoforms type
1 17 8 rat_ensembl
2 8 9 rat_ensembl
3 20 10 rat_ensembl
4 37 8 rat_all
5 31 9 rat_all
6 14 10 rat_all
7 11 11 rat_all
8 2 12 rat_all
9 3 13 rat_all
10 0 11 rat_ensembl
11 0 12 rat_ensembl
12 0 13 rat_ensembl
如果我使用的话,我可以让它做我想做的事:
z = merge(rat_ensembl, rat_all, by.x="isoforms", by.y="isoforms", all.y=TRUE)
isoforms frequency.x type.x frequency.y type.y
7 7 44 rat_ensembl 69 rat_all
8 8 17 rat_ensembl 37 rat_all
9 9 8 rat_ensembl 31 rat_all
10 10 20 rat_ensembl 14 rat_all
11 11 NA <NA> 11 rat_all
12 12 NA <NA> 2 rat_all
13 13 NA <NA> 3 rat_all
14 14 NA <NA> 1 rat_all
然后,从理论上讲,我可以选择isoforms
,frequency.x
,type.x
列和
修复它们,使其对rat_ensembl
和rat_all
以及rbind
中的每一个都正确
数据框在一起,但似乎应该有一些东西直接处理它。
答案 0 :(得分:2)
也许你想要这样的东西
z <- merge(rat_ensembl, rat_all, all = TRUE)
iso_diff <- setdiff(rat_all$isoforms, rat_ensembl$isoforms)
augmented <- data.frame(frequency = 0, isoforms = iso_diff, type = "rat_ensembl", stringsAsFactors= FALSE)
df_all <- rbind(z, augmented)
希望有所帮助。