我有一个在R中只有一列的data.frame。我从数据库中获取了一个SQL查询。在该数据库中,该列具有TIMESTAMP作为数据类型。在R中,data.frame具有数据类型" double"
typeof(MyTable$TimeLogs)
[1] "double"
数据看起来像这样(超过800行):
2016-07-19 11:24:53
2016-07-19 11:24:58
2016-07-19 11:25:03
2016-07-19 11:25:09
...
2016-07-19 19:16:05
2016-07-19 19:16:35
2016-07-19 19:17:05
2016-07-19 19:17:35
2016-07-19 19:18:06
我想要一个直方图,显示某个"休息时间"之间的记录频率。我在R中的陈述是:
hist(MyTable$TimeLogs, breaks = "hours",
col="red", main = "Histogramm of 2016-07-19",
xlab = "Timestamp", ylab = "Frequency")
所以我可以看到11:00:00到12:00:00之间有多少时间日志等等......(或者可能在30分钟内休息)。我现在的问题是,直方图看起来像这样:
如图所示,y轴上的比例非常混乱。它应该从2到50(而不是从0.00000到0.00005)。我想这与TimeLogs的time / double-datatype有关。任何想法如何正确的比例,或将数据转换为正确的格式,仍然有一个有意义的Y轴?答案 0 :(得分:1)
只需将freq = TRUE参数添加到hist调用中。
MyTable <- data.frame(TimeLogs=Sys.time()+round(rnorm(1000,5000,2500)))
hist(MyTable$TimeLogs, breaks = "hours",
col="red", main = "Histogramm of 2016-07-19",
xlab = "Timestamp", ylab = "Frequency",freq=TRUE)