我在R工作,我有一个以秒为单位的会话持续时间表,以及具有该长度会话的用户数。以下是一些示例行:
sessionDuration,users
936,5
937,3
938,2
939,4
940,12
941,2
942,4
943,1
944,3
945,4
...
我想绘制一个显示会话持续时间分布的直方图。例如,标签为200-400,400-600,600-800,800-1000秒的列,然后将用户计数作为每列的y值。
我该怎么做?
据我所知:
mydata <- read.csv('./session-durations.csv', header=TRUE)
hist(mydata$users,main="Distribution of users",xlab="users")
但这只显示了“用户”价值的分布。
答案 0 :(得分:0)
试试这个:
a <- unlist(lapply(seq_along(sampledata$users),
function(x)rep(sampledata[x,1], sampledata[x,2])))
hist(a, main="Distribution of users",xlab="users")