我将数据放在以空格分隔的文本文件中;每行代表给定月份中包含的数据点:
Jan/2012 1000 Jan/2012 1500 Jan/2012 1200 Feb/2012 1300 Feb/2012 1400 Feb/2012 1000 ... Dec/2012 1300 Dec/2012 1400 Dec/2012 1000
我想为每个月生成最小值,最大值,中值,平均值,标准差和第95个分位数。我还想生成一整年的箱线图。我怎么能在R中这样做?我可以使用mydata = read.table(file="mydata.txt", sep=" ")
加载数据,但摘要会生成如下输出:
month time Aug/2012: 229357 Min. : 31100 Oct/2012: 223158 1st Qu.: 91267 Mar/2012: 221986 Median : 124048 Apr/2012: 215368 Mean : 199639 Jul/2012: 213956 3rd Qu.: 176766 May/2012: 200920 Max. :150018802 (Other) :1146616
我没有任何生成箱图的经验;欢迎指导。
答案 0 :(得分:1)
tapply(dfrm$time, substr(dfrm$month, 1,3), summary)
library(Hmisc)
tapply(dfrm$time, substr(dfrm$month, 1,3), describe)
boxplot(time~month, data=dfrm)