我在解释ggplot2中binwidth的含义时遇到麻烦,并且我正在寻找它的含义的更精确定义。
例如:
#this is example is taken from Elegant Graphics for Data Analysis
library(ggplot2)
qplot(percbelowpoverty, data = midwest,binwidth=1)
如何解释binwidth = 1?它的单位是什么?这与计算的箱数有何关系?我一无所知,找不到stan_bin有助于回答我的问题:
binwidth
垃圾箱的宽度。可以指定为数值或从x计算宽度的函数。默认设置是使用bins覆盖数据范围的bins。您应该始终覆盖此值,探索多种宽度以找到最好的方式来说明数据中的故事。
日期变量的bin宽度是每次的天数;时间变量的bin宽度是秒数。
也许只是不知道在哪里寻找这样的文档,因为我很难理解许多相关问题(例如“重量”美学的含义)。
答案 0 :(得分:0)
我想我已经回答了我自己的问题。我遇到了麻烦,因为我误读了x轴单位。 Midwest $ percwhite列中的百分比实际上不是百分比(即96.7在我们看来是96.7%,但作为数据它是实际数字96.7)。出于这个原因,我对如何解释binwidth参数感到困惑。现在,我看到它具有MrFlick在评论中提供的标准解释:
设置binwidth = 1表示每个bin的宽度应为一个x单位,例如(1-2],(2-3],(3,4]等。单位是中西部$ percbelowpoverty的单位)值在其中。