我正在尝试对group =(Entry + Plant)的大型数据集运行一些摘要统计。我正在使用summaryBy()函数,它似乎适用于我的大多数变量。然而,它使用未知函数转换我的一个变量(YieldPlant)并且不正确地计算平均值和标准偏差。以下是一些示例输出:
> library(doBy)
> SP.data <- read.csv("~/Desktop/2014 Summer Research/Within-Line Variation Trial/2014 Heirloom Variation Trial.csv", na.string = c("NA"))
> head(SP.data$YieldPlant, n=10) [1] NA NA NA NA 16.16 18.58 11.2 10.95 11.61 13.94
> summaryTRAITS <- summaryBy(YieldPlant ~ Entry + Plant, data=SP.data, FUN = function(Plant) { c(m=mean(Plant, na.rm=T), s=sd(Plant, na.rm=T))})
> head(summaryTRAITS$YieldPlant.m, n=10) [1] NaN 307.8571 444.0000 364.0000 179.5714 354.2857 592.1429 521.3333 729.8571 322.4286
&#34; YieldPlant&#34;应该比R小得多认识。我很感激你们所能提供的任何帮助。谢谢!
汉娜