我试图在数据帧的一列中绘制值的直方图。我尝试设置bin或binwidth args但无济于事。在构建情节时R表示,"忽略未知参数:binwidth,bin,pad"。
ggplot(data=subset(flights, Distance < quantile(flights$Distance, 0.75)))+
geom_histogram(aes(x=Distance), stat='count', binwidth=100)
要绘制的变量是整数矢量,航班距离。
我尝试将数据类型从整数更改为数字。
flights$Distance <- as.numeric(as.character(flights$Distance))
我在一个较小的样本上试了一下并得到了同样的信息。
df <- data.frame(Distance=c(2,3,4,5,3,2,4,5,6,7,5,4,9,8,7,6,5,4,3,4,5,6,5))
ggplot(data=df)+
geom_histogram(aes(x=Distance), stat='count', binwidth=2)
为什么ggplot会忽略两个可能的bin参数?
答案 0 :(得分:1)
也许this会有所帮助:
通过划分可视化单个连续变量的分布 将x轴放入箱中并计算每个箱中的观测数 完事。直方图(geom_histogram)用条形显示计数; 频率多边形(geom_freqpoly),用线条显示计数。 当你想比较时,频率多边形更合适 跨分类变量的分布。 stat_bin 仅适用于连续x数据。如果您的x数据是离散的, 你可能想要使用stat_count。
ggplot()+
geom_histogram(data = df, aes(x=Distance), binwidth = 3) +
stat_count()