折线图问题-图表看起来“有趣”(ggplot2)

时间:2018-10-08 11:22:16

标签: r ggplot2 linechart

我在许多国家/地区拥有多年的大型数据框(CO2_df),并尝试使用ggplot2绘制图形。该图将具有6条曲线+一条聚合曲线。但是,我的图看起来很“有趣”,我不知道为什么。

数据如下(摘录):

       x     y          x1      x2      x4   x6
1553   1993  0.00000    CO2     Austria  6   6 - Other Sector
1554   2006  0.00000    CO2     Austria  6   6 - Other Sector
1555   2015  0.00000    CO2     Austria  6   6 - Other Sector
2243   1998  12.07760   CO2     Austria  5   5 - Waste management
2400   1992  11.12720   CO2     Austria  5   5 - Waste management
2401   1995  11.11040   CO2     Austria  5   5 - Waste management
2402   2006  10.26000   CO2     Austria  5   5 - Waste management
2489   1998  0.00000    CO2     Austria  6   6 - Other Sector

我使用了以下代码:

ggplot(data=CO2_df, aes(x=x, y=y, group=x6, colour=x6)) +
  geom_line() +
  geom_point() +
  ggtitle("Austria") +
  xlab("Year") +
  ylab("C02 Emissions") +
  labs(colour = "Sectors")
scale_color_brewer(palette="Dark2")  

CO2_df %>%
  group_by(x) %>%
  mutate(sum.y = sum(y)) %>%
  ggplot(aes(x=x, y=y, group=x6, colour=x6)) +
  geom_line() +
  geom_point() +
  ggtitle("Austria") +
  xlab("Year") +
  ylab("C02 Emissions") +
  labs(colour = "Sectors")+
  scale_color_brewer(palette="Dark2")+
  geom_line(aes(y = sum.y), color = "black") 

我的问题

1)为什么看起来像这样,我该如何解决? 2)我不知道为什么y轴上的值接近零。他们不是... 3)如何在图例中为聚合行添加条目?

this

谢谢您的帮助!

Nordsee

1 个答案:

答案 0 :(得分:1)

那这样的事情呢?

  CO2_df %>%                            # data                 
  group_by(x,x6) %>%                    # group by
  summarise(y = sum(y)) %>%             # add the sum per group
  ggplot(aes(x=x, y=y)) +               # plot
  geom_line(aes(group=x6, fill=x6, color=x6))+
  # here you can put a summary line, like sum, or mean, and so on
  stat_summary(fun.y = sum, na.rm = TRUE, color = 'black', geom ='line') +
  geom_point() +
  ggtitle("Austria") +
  xlab("Year") +
  ylab("C02 Emissions") +
  labs(colour = "Sectors")+
  scale_color_brewer(palette="Dark2"))

enter image description here

为了修改正确的数据,为了了解正确的行为,我投入了相同的年份和不同的价值观来理解:

   CO2_df <- read.table(text ="
x     y          x1      x2      x4   x6
1553   1993  20    CO2     'Austria'  6   '6 - Other Sector'
1554   1994  23    CO2     'Austria'  6   '6 - Other Sector'
1555   1995  43    CO2     'Austria'  6   '6 - Other Sector'
2243   1993  12.07760   CO2     'Austria'  5   '5 - Waste management'
2400   1994  11.12720   CO2     'Austria'  5   '5 - Waste management'
2401   1995  11.11040   CO2     'Austria'  5   '5 - Waste management'
2402   1996  10.26000   CO2     'Austria'  5   '5 - Waste management'
2489   1996  50    CO2     'Austria'  6   '6 - Other Sector'", header = T)