我正在尝试为我的整数变量创建一个直方图,该变量的值非常不一致,这是应用于该变量的摘要函数的输出:
最少:347第一届:8786中位数:20886平均值:69522第三届:50400最大:4069360
所以您可以看到它的范围从300到4,000,000
这是我用来创建直方图的代码:
ggplot(data=mydata, aes(mydata$variable)) +
geom_histogram(aes(y =..density..),
breaks=seq(300, 2000000, by = 20000),
col="#00AFBB",
fill="#00AFBB",
alpha=.2) +
geom_density(col=2) +
尽管我使用了seq参数并使用了不同的值,但直方图仍然从0开始,以4000000结尾,如下所示:
我该怎么做才能调整直方图,使其看起来更加平衡并正确绘制值?
答案 0 :(得分:0)
您可以对映射到x轴的值施加限制,以有效地将其过滤掉:
+ scale_x_continouous(limits=c(0, 1000000))
或放大绘图的相关部分:
+ coord_cartesian(xlim=c(0, 1000000))
请注意,您的第一行可以简化为:
ggplot(mydata, aes(variable)) +
as data
是ggplot的第一个参数,并且aes
中引用的变量总是在data.frame中搜索(给定{{1} }参数。