我有几个org
的以下格式的数据(这里显示a到d,有些有3个,有些有4个样本):
org unfiltered filtered
org_a 50.82 67.82
org_a 57.72 58.31
org_a 67.82 55.72
org_a 58.31 52.72
org_b 55.72 57.72
org_b 52.72 51.82
org_b 57.72 52.72
org_c 51.82 63.82
org_c 52.72 66
org_c 63.82 61
org_d 66 62
org_d 61 63
org_d 62 64
org_d 63 62
我已经为每个组织计算了mean
(excel中的AVERAGE函数),然后通过手动转置数据来计算standard error
(excel中的STDEV.S / SQRT(COUNT(sample1:sample4))函数) 。
我可以看到未经过滤的情节和过滤情节中不同org
之间的差异。我正在考虑应用非配对t检验来获得p值,以分别显示未过滤数据和过滤数据的不同组织之间的统计差异。
我在R中的原始数据上使用了以下代码来计算不同的参数但无法进一步计算t检验。
summary(data)
aggregate(data[,2:3],by=list(org=data$org),FUN=mean)
aggregate(data[,2:3],by=list(org=data$org),FUN=sd)
dataMelt <- melt(as.data.frame(data))
g = ggplot(dataMelt)
g = g + geom_boxplot(aes(x=org,y=value))
g = g + facet_wrap(~variable)
g
箱形图没什么用处。我还想制作过滤和未过滤数据的条形图,显示p值的标准误差。任何指导都将不胜感激。