我正在使用ddply
,并且在更改功能顺序时,有时有些是NA
。这是一个可复制的示例(除了右边2列中的值,我保留了所有字符串,就像我原来的df一样):
演示df:
test_ddplyr=data.frame(genotype=c(rep("dr5_dmso", 5), rep("184_2_bc1_2_2", 5)),
root=c("r1s6", "r2s4", "r3s2", "r4s3", "r5s1", "r2s4", "r3s2", "r4s3", "r1s2",
"r5s4"), area=c(1:10), intensity=seq(100, 1000, 100))
正确的ddply输出:
ok_ddply=ddply(test_ddplyr, .(genotype), summarise, se_area=sd(area)/sqrt(length(area)),
se_intensity=sd(intensity)/sqrt(length(intensity)), area=mean(area),
intensity=mean(intensity))
{p> se_area
列的ddply输出不正确是NA:
bad_ddply=ddply(test_ddplyr, .(genotype), summarise,
se_intensity=sd(intensity)/sqrt(length(intensity)), area=mean(area),
intensity=mean(intensity), se_area=sd(area)/sqrt(length(area)))
有什么建议吗? 非常感谢, 盖伊