set.seed(1432)
n_len <- 400000
jdc<- data.frame(rnd = numeric(n_len))
jdc$rnd <- runif(n_len,0,1)
ggplot(jdc,aes(x = rnd)) + geom_density()
正如您将注意到,随机变量的分布向两个边界下降。
我试图根据一些不到rnd的样本进行采样,但是i的范围介于0,.05之间,因此这种分布是个问题。
答案 0 :(得分:11)
这与密度估算器有关,而与runif()
有关。最好使用直方图来查看数据:
ggplot(jdc, aes(x = rnd)) + geom_histogram(binwidth = 0.01, boundary = 0)
正如joran指出的那样,人们还可以创建一个直方图,显示与密度估算器类似的偏差:
ggplot(jdc, aes(x = rnd)) + geom_histogram()
直方图的优点是易于理解,为什么会发生这种情况。最左边和最右边的箱子分别以0和1为中心。这意味着,例如,最左边的箱从-0.005变为0.005。但是没有数据点低于零,所以这个间隔只包含大约一半的点数。