ggplot2的mpg数据集 - 什么是“fl”。变量?

时间:2014-08-28 12:18:08

标签: r ggplot2 dataset

ggplot2 的内置mpg数据集中,有一个名为" fl。"的变量,这是一个具有级别的因素:" c&# 34;," d"," e"," p",& " R&#34 ;.

有谁知道这些字母应该代表什么?毋庸置疑,谷歌搜索这些信件还没有给我任何相关的线索......

library(ggplot2)
data(mpg)
str(mpg)
?mpg

[注意:SO上有一个similar question mtcars 数据集,这给我的印象是这将是适合此类问题的论坛。]

1 个答案:

答案 0 :(得分:13)

燃料:

  • e:乙醇E85,注意(subset(mpg, fl=="e")仅提起“新”美国汽车,并且燃油经济性远低于相应的可能的汽油模型,后者与乙醇的能量含量较低一致<) / LI>
  • d:diesel
  • r:regular
  • p:premium
  • c:CNG(注意据我所知,思域在美国基本上是the only passenger car that runs on CNG

注意,除了基于其他数据的有根据的猜测之外,我没有理由知道这一点,但这里有一些图形证据:

ggplot(mpg, aes(x=fl, y=hwy)) + geom_boxplot() + facet_wrap(~cyl, nrow=1)

enter image description here

请注意e始终如一的低d至少在数据点超过1的情况下(柴油具有更高的能量含量)且p始终高于{{ 1}}(高级允许汽车以更高的压缩比和效率运行,但实际上,优质的能量含量低于常规)对于每个汽缸类别(小平面是汽缸数)。


更新:根据@ naught101,现在看来是documented