Question

我正在尝试对group =（Entry + Plant）的大型数据集运行一些摘要统计。我正在使用summaryBy（）函数，它似乎适用于我的大多数变量。然而，它使用未知函数转换我的一个变量（YieldPlant）并且不正确地计算平均值和标准偏差。以下是一些示例输出：

> library(doBy)
> SP.data <- read.csv("~/Desktop/2014 Summer Research/Within-Line Variation Trial/2014 Heirloom Variation Trial.csv", na.string = c("NA"))
> head(SP.data$YieldPlant, n=10)    [1] NA  NA  NA  NA  16.16 18.58 11.2  10.95 11.61 13.94
> summaryTRAITS <- summaryBy(YieldPlant ~ Entry + Plant, data=SP.data, FUN = function(Plant) { c(m=mean(Plant, na.rm=T), s=sd(Plant, na.rm=T))})
> head(summaryTRAITS$YieldPlant.m, n=10)     [1]  NaN 307.8571 444.0000 364.0000 179.5714 354.2857 592.1429 521.3333 729.8571 322.4286

＆＃34; YieldPlant＆＃34;应该比R小得多认识。我很感激你们所能提供的任何帮助。谢谢！

汉娜

在R的“doBy”包中使用“summaryBy”函数时如何停止数据转换

0 个答案: