如何通过排列数据框来操纵绘图的顺序

时间:2017-08-31 10:32:32

标签: r sorting plot ggplot2 tidyverse

通常当我想重新排序例如条形图时,我在ggplot轴上使用reorder()函数。现在这是一个选项,但它有时会让我感到困惑coord_flip()并且我不喜欢这种做事方式。我宁愿操纵数据本身。

我的数据框:

library(tidyverse)

warCasualties <- tibble(Who = c("N. Vietnam + communist allies",
               "South Vietnam",
               "Vietnamese civilians",
               "United States",
               "Allied forces"),
       Type = c("Military",
                "Military",
                "Civilians",
                "Military",
                "Military"),
       Estimated.deaths = c((950765 + 1100000)/2,
                            (110000 + 313000)/2,
                            2000000,
                            58220,
                            5341)) 

我想做以下事情,但我的情节不像数据框那样顺序。

warCasualties %>%
  arrange(desc(Estimated.deaths)) %>%
  ggplot(aes(x = Estimated.deaths, y = Who)) +
  geom_segment(aes(x = 0, y = Who, xend = Estimated.deaths, yend = Who)) +
  geom_point() 

2 个答案:

答案 0 :(得分:2)

你可以使用包forcats作为它的函数fct_inorder(),它会将因子的级别设置为它们在你安排的tibble中的应用顺序。 ggplot()正在寻找一个因子变量来确定轴顺序,如果它不是一个因素,它将与as.factor()(无声地)一起产生,产生你所看到的字母顺序。

library(forcats)

warCasualties %>%
    arrange(desc(Estimated.deaths)) %>%
    mutate(Who = forcats::fct_inorder(Who)) %>%
    ggplot(aes(x = Estimated.deaths, y = Who)) +
    geom_segment(aes(x = 0, y = Who, xend = Estimated.deaths, yend = Who)) +
    geom_point() 

enter image description here

我不确定为什么forcats没有加载tidyverse。这将是一个很好的补充,因为它有一些很好的因子工具,它是由Hadley和Co建造的。

答案 1 :(得分:0)

这个基本解决方案怎么样:

  ggplot(warCasualties,aes(x = Estimated.deaths, y = reorder(Who, -Estimated.deaths))) +
  geom_segment(aes(x = 0, y = reorder(Who, -Estimated.deaths), xend = Estimated.deaths, yend = Who)) +
  geom_point() 

enter image description here

使用reorder(Who, -Estimated.deaths)让谁从高 - 低订购。