给出一个包含4列的数据框(我的数据框包含约40个基因)
my_df <- read.table(header=T, text="
count gene group sample
0.1 gene1 exp S_1
0.2 gene1 exp S_2
0.5 gene2 cnt S_1
0.6 gene2 exp S_1
0.2 gene2 exp S_2
0.4 gene1 cnt S_1
0.3 gene1 cnt S_2
0.2 gene1 cnt S_3
我想折叠每个基因的计数值并按组(exp和cnt)折叠 这是作为数据帧的期望输出:
count gene group
0.3 gene1 exp
0.9 gene1 cnt
0.8 gene2 exp
0.5 gene2 cnt
一些规格: 可以删除“列”(Colum)“样本”,因为它只是显示了成对的每个组的基因出现数量。 非常感谢您的建议
答案 0 :(得分:1)
library(dplyr)
my_df %>% group_by(gene, group) %>%
summarise(count = sum(count))