ggplot:绘制虚拟变量

时间:2020-06-12 11:31:36

标签: r ggplot2 histogram boxplot

这里的新手:)如果您能给我任何帮助/建议,我将不胜感激。 我正在尝试绘制/散点图/箱线图/历史记录我用于视觉检查的数据,并且可以说我通过其他一些命令到达了想要的位置...但是当我对ggplot尝试相同时,我无法获得到最后

这是我的数据“ alc3“>的一部分,其中包含每种饮料类型的虚拟变量

                              Author   est   se beer wine spirits
1    Andrikopoulos and Loizides(2000) -1.00 0.18    1    0       0
2    Andrikopoulos and Loizides(2000) -0.35 0.32    1    0       0
3           Andrikopoulos et al. 1997 -1.00 0.46    1    0       0
4           Andrikopoulos et al. 1997 -1.02 0.46    1    0       0
5           Adrian and Ferguson(1987) -0.84 0.17    1    0       0
6           Andrikopoulos et al. 1997 -0.48 0.13    1    0       0
7           Andrikopoulos et al. 1997 -0.08 0.07    1    0       0
8                          Quek(1988) -0.28 0.03    1    0       0
9                Johnson et al.(1992) -0.14 0.05    1    0       0
10               Johnson et al.(1992) -0.26 0.06    1    0       0
11  Selvanathan and Selvanathan(2005) -0.43 0.11    1    0       0
12          Adrian and Ferguson(1987) -0.37 0.15    1    0       0
13                  Selvanathan(1991) -0.26 0.17    1    0       0
14                         Quek(1988) -0.16 0.22    1    0       0
15                          Lau(1975) -0.43 0.39    1    0       0
16  Selvanathan and Selvanathan(2004) -0.16 0.03    1    0       0 

我希望能够将箱形图或散点图放在板条箱中,而ggplot仅可用于一种饮料(即啤酒)。如果我使用此代码>

boxplot(est[beer=="1"] ~ Author[beer=="1"], 
main="Boxplot of Bier elasticities", 
xlab="Price elasticity", ylab=" ", 
ylim=c(-5,3), las=1, 
horizontal = TRUE) 

然后,我可以分别选择啤酒/葡萄酒/烈酒,并获得三种不同的箱形图(或直方图-这是我的目标,因为我想分别进行评估),但使用ggplot只能生成所有饮料的代码。

 ggplot(alc3, aes(x=est, y=Author) + geom_boxplot() +
  ggtitle("Price elasticities of alcohol") + 
  xlab("Estimates") +
  ylab(" ")) 

我试图生成新变量

beer1 <- alc3$est[beer=="1"] 
Author1 <- alc3$Author[beer=="1"]

但是即使我将它们替换为aes(x = beer1,y = Author1)....我也收到此错误消息>

Error: Aesthetics must be either length 1 or the same as the data (406): x and y"

尽管它们具有相同的长度。

还有其他方法吗?任何人都可以建议应更改的内容。

非常感谢!! 阿妮塔

2 个答案:

答案 0 :(得分:0)

如果使用ivot_longer将数据从宽格式重整为长格式,则可以绘制所需的图。在这里https://tidyr.tidyverse.org/reference/pivot_longer.html

想法是使用“啤酒”,葡萄酒和烈酒作为值创建一个新的“饮料”变量,然后使用新的“饮料”变量制作ggplot

答案 1 :(得分:0)

您可以像对boxplot()那样过滤数据:

library(tidyverse)
library(ggplot2)

# note: I changed the data a bit, so that it wasn't "just beer", to make the second example work

alc3 <- tribble(~Author,                             ~est,  ~se,  ~beer, ~wine, ~spirits,
                 "Andrikopoulos and Loizides(2000)", -1.00, 0.18,  1,     0,     0,
                 "Andrikopoulos and Loizides(2000)", -0.35, 0.32,  0,     1,     0,
                        "Andrikopoulos et al. 1997", -1.00, 0.46,  0,     0,     1,
                        "Andrikopoulos et al. 1997", -1.02, 0.46,  0,     1,     1,
                        "Adrian and Ferguson(1987)", -0.84, 0.17,  1,     0,     0,
                        "Andrikopoulos et al. 1997", -0.48, 0.13,  1,     1,     0,
                        "Andrikopoulos et al. 1997", -0.08, 0.07,  1,     0,     1,
                                       "Quek(1988)", -0.28, 0.03,  0,     1,     0,
                             "Johnson et al.(1992)", -0.14, 0.05,  1,     0,     0,
                             "Johnson et al.(1992)", -0.26, 0.06,  1,     0,     0,
                "Selvanathan and Selvanathan(2005)", -0.43, 0.11,  0,     1,     1,
                        "Adrian and Ferguson(1987)", -0.37, 0.15,  1,     0,     1,
                                "Selvanathan(1991)", -0.26, 0.17,  1,     1,     0,
                                       "Quek(1988)", -0.16, 0.22,  0,     1,     0,
                                        "Lau(1975)", -0.43, 0.39,  1,     0,     1,
                "Selvanathan and Selvanathan(2004)", -0.16, 0.03,  1,     0,     1)


# example with filtering:

alc3 %>%
  filter(beer == 1) %>% 
  ggplot(aes(y=est, x=Author)) + geom_boxplot() +
           ggtitle("Price elasticities of beer") + 
           xlab("Estimates") +
           coord_flip()


# example with pivoted, tidy data and `face_wrap()`

alc3 %>% 
  pivot_longer(cols = 4:6, names_to = "alcohol") %>% 
  filter(value == 1L) %>% 
  ggplot(aes(y=est, x=Author)) + 
           geom_boxplot() +
           facet_wrap(~alcohol) +
           coord_flip() +
           ggtitle("Price elasticities of alcohol") + 
           xlab("Estimates") +
           ylab(" ") +
          theme(axis.text.x = element_text(angle = 90))

编辑:使用forcats::fct_relevel()更改顺序:


alc3 %>% 
  pivot_longer(cols = 4:6, names_to = "alcohol") %>% 
  filter(value == 1L) %>% 
  mutate(alcohol = forcats::fct_relevel(alcohol, "wine", "beer", "spirits")) %>% 
  ggplot(aes(y=est, x=Author)) + 
  geom_boxplot() +
  facet_wrap(~alcohol) +
  coord_flip() +
  ggtitle("Price elasticities of alcohol") + 
  xlab("Estimates") +
  ylab(" ") +
  theme(axis.text.x = element_text(angle = 90))

reprex package(v0.3.0)于2020-06-13创建