我有一个2M unix时间戳的数据框,我想制作一个月度直方图。有什么建议?感谢
答案 0 :(得分:1)
如果DF
是我们的测试数据,那么取出具有相同年份和月份的所有数据点的平均值,给出动物园对象z
并绘制它:
# test data
DF <- data.frame(Time = as.POSIXct(Sys.Date() + 1:1000), data = 1:1000)
library(zoo)
z <- read.zoo(DF, aggregate = mean, FUN = as.yearmon)
plot(z, type = "h")
答案 1 :(得分:0)
解析它们(例如通过as.POSIXct()
),以便使用正确的DateTime对象。
然后使用聚合例程,例如zoo和xts包具有时间索引结构,或者ddply更常用,或者您可以使用基本R函数。
您没有在直方图中说明要显示的 。算一算?在这种情况下,这是一个简单的例子:
R> set.seed(42) # fix RNG
R> zz <- data.frame(val=runif(100), ts=Sys.time() - 6*31*24*60*60*runif(100))
R> summary(zz) # values over June to Nov 2011 period
val ts
Min. :0.000239 Min. :2011-06-01 09:56:20.50
1st Qu.:0.259673 1st Qu.:2011-07-10 01:43:58.81
Median :0.539714 Median :2011-08-14 22:19:12.73
Mean :0.524479 Mean :2011-08-22 17:57:00.34
3rd Qu.:0.763614 3rd Qu.:2011-10-11 10:24:16.34
Max. :0.988892 Max. :2011-11-27 03:51:25.63
R> zz$mon <- as.POSIXlt(zz$ts)$mon + 1
R> summary(zz) # now we have the month as a column
val ts mon
Min. :0.000239 Min. :2011-06-01 09:56:20.50 Min. : 6.00
1st Qu.:0.259673 1st Qu.:2011-07-10 01:43:58.81 1st Qu.: 7.00
Median :0.539714 Median :2011-08-14 22:19:12.73 Median : 8.00
Mean :0.524479 Mean :2011-08-22 17:57:00.34 Mean : 8.29
3rd Qu.:0.763614 3rd Qu.:2011-10-11 10:24:16.34 3rd Qu.:10.00
Max. :0.988892 Max. :2011-11-27 03:51:25.63 Max. :11.00
R> ddply(zz, .(mon), "nrow") # so count rows by month
mon nrow
1 6 17
2 7 22
3 8 18
4 9 15
5 10 14
6 11 14
R>
你可以按月轻松完成这些计数的直方图。