我很高兴能够学习dplyr,但是,除了基本的东西之外,它还能做得更多。
基本上,我想规范化数据(将条目除以行数之和)
apply(normalized.messy,2,sum)/sum(apply(normalized.messy,2,sum))
然后我想识别这样的列
messy <- data.frame(samples = c("s1", "s2", "s3", "s4"),
o1 = c(1,2,1,2),
o2 = c(2,3,0,1),
o3 = c(3,2,0,1),
o4 = c(1,1,4,4))
bb = gather(messy, otu, counts, o1:o4)
group_by(bb, otu) %>% mutate(nr = scale(count))
bb.nr = group_by(bb, otu) %>% mutate(nr = scale(count))
我做过类似下面的事情
Error: cannot coerce type 'closure' to vector of type 'any'
但是得到以下错误,
{{1}}
我很感激纠正缩放部分以及过滤
答案 0 :(得分:0)
为了解决您所遇到的错误,我怀疑这是因为您将列数命名为(带有s),而不仅仅是计数。
就你的dplyr代码而言,我认为你有第一组向后。这是我对你想要的东西的理解。首先,您希望按样本分组以获得每个样本的OTU比例,然后您希望按OTU分组以获得样本间的平均OTU比例:
messy <- data.frame(samples = c("s1", "s2", "s3", "s4"),
o1 = c(1,2,1,2),
o2 = c(2,3,0,1),
o3 = c(3,2,0,1),
o4 = c(1,1,4,4))
bb <- gather(messy, otu, counts, o1:o4)
bb %>% group_by(samples) %>% mutate(prop = counts/sum(counts)) %>%
group_by(otu) %>% summarize(mean(prop))