this question的答案使用PANEL
变量,该变量似乎是ggplot
的内部变量。但是搜索ggplot documentation和Hadley Wickham's book,我根本找不到它的参考。这是在任何地方记录的吗?
另外,查看stat_bin(...)
的代码,显然创建了一个向量count
(其中包含每个唯一x的y的计数)。这也可以在aes(...)
中访问,但是,我再也找不到文档。
所以我的问题是:是否存在记录所有这些内部变量的地方,或者只需要一个代码转到代码?
答案 0 :(得分:5)
ggplot2的帮助页面中有一些令人惊讶的差距(我还要指向?层的帮助页面,许多其他页面将用户称为一个特别令人震惊的差距。)这些“变量”已存在多年和你一样,我在在线帮助或包裹新闻中找不到多少。 SO的搜索工具没有多大帮助,因为它剥离了前导和尾随点,并以“计数”显示所有内容。只有它们的使用示例可以在cran.r-project.org/web/packages/ggplot2/ggplot2.pdf中找到。谷歌更有帮助,搜索字符串:ggplot2 ..counts ..提供了许多信息性的点击。从上下文中可以看出,这些形式不是特殊变量,而是组合函数和程序控制。这些参数隐式转换命名参数。它们确实在?stat_bin {ggplot2}
中被隐含地提及,虽然没有点,并且看起来所有这四个属性变量函数都是同时计算的。
当我在pdf中搜索你链接到我在57-58页(#4.3,4.4)的“统计数据”和“美学”中找到了你所要求的,但令我惊讶的是它没有包含count
。这些表格在第4.7节中描述了“统计数据”。
(我注意到这些投诉所针对的某些页面的改进或过去几年。)
答案 1 :(得分:2)
我认为PANEL是绘图的组件数据中的一列。您将获得列名称列表:
names(ggplot_build(x)$data)
对于 count 和频率变量,您可以参考Hadley的书籍,第69页:
直方图和频率多边形geom都使用stat_bin。这个 统计量产生两个输出变量count和density。伯爵 是默认值,因为它是最可解释的。密度基本上是 计数除以总计数,在您需要时非常有用 比较分布的形状,而不是整体大小。你会 在比较具有的子集的分布时,通常更喜欢这种情况 不同的尺寸。