在 ggplot2 的内置mpg数据集中,有一个名为" fl。"的变量,这是一个具有级别的因素:" c&# 34;," d"," e"," p",& " R&#34 ;.
有谁知道这些字母应该代表什么?毋庸置疑,谷歌搜索这些信件还没有给我任何相关的线索......
library(ggplot2)
data(mpg)
str(mpg)
?mpg
[注意:SO上有一个similar question: mtcars 数据集,这给我的印象是这将是适合此类问题的论坛。]
答案 0 :(得分:13)
燃料:
subset(mpg, fl=="e")
仅提起“新”美国汽车,并且燃油经济性远低于相应的可能的汽油模型,后者与乙醇的能量含量较低一致<) / LI>
注意,除了基于其他数据的有根据的猜测之外,我没有理由知道这一点,但这里有一些图形证据:
ggplot(mpg, aes(x=fl, y=hwy)) + geom_boxplot() + facet_wrap(~cyl, nrow=1)
请注意e
始终如一的低d
至少在数据点超过1的情况下(柴油具有更高的能量含量)且p
始终高于{{ 1}}(高级允许汽车以更高的压缩比和效率运行,但实际上,优质的能量含量低于常规)对于每个汽缸类别(小平面是汽缸数)。
更新:根据@ naught101,现在看来是documented。