了解R中直方图的ggplot

时间:2016-07-19 09:31:22

标签: r math ggplot2 histogram

我使用ggplot2包在R中创建一些直方图。我只是想检查一下我是否正确理解了语法/参数。代码如下。

ggplot(data=q2_table, aes(q2_table$some_column)) + 
geom_histogram(breaks=seq(0, 500, by = 2), 
col="black", 
fill="grey", 
alpha = .2) + 
labs(title="Histogram for Distribution of Some Column") +
labs(x="Days Binned", y="Count") + 
xlim(c(0,300)) + 
ylim(c(0,100000))

我的理解是:

  • 我选择了一个名为" some_column"来自表格" q2_table"
  • 此列中的最小值/最大值分别为0和500
  • 条纹为灰色,轮廓为黑色
  • 标题是"某些列的分布直方图"
  • x和y标签是" Days Binned"和"伯爵"分别
  • x轴的限制为300
  • y轴的限制为100,000

假设以上是正确的,我的问题如下;

  • 什么是" by = 2"争论呢?
    geom_histogram(breaks=seq(0, 500, by = 2)
  • " alpha = .2"涉及到什么? alpha = .2)+
  • geom_histogram(breaks=seq(0, 500, by = 2)xlim(c(0,300))之间是否存在关联,以使最后一个bin的大小基本上为300+? 换句话说,xlim(c(0,300))是一种根据geom_histogram(breaks=seq(0, 500, by = 2),
  • 中定义的最小/最大值确定箱尺寸的方法

下面的直方图用于说明。

enter image description here

1 个答案:

答案 0 :(得分:0)

问题1:什么是“by = 2”参数?

答案1:“按= 2”表示条形图以2的间隔创建

问题2:“alpha = .2”与“

”有什么关系?

答案2:这与图表的不透明度有关,alpha = 1表示纯色,alpha = 0表示绝对透明。所以alpha = 0.2已被用来减轻条形阴影。

问题3: geom_histogram(breaks = seq(0,500,by = 2)和xlim(c(0,300))之间是否存在关系,以便最后一个bin的大小基本上换句话说,xlim(c(0,300))是一种根据geom_histogram中定义的最小/最大值确定bin大小的方法(breaks = seq(0,500,by = 2)?

答案3:是的,两者之间存在关系。它只是第一个设置范围,第二个必须在该范围内定义。

如果你什么都不懂,请告诉我。我非常乐意提供帮助:)