带有日期格式(yyyy-mm-dd)的离散x轴的ggplot问题

时间:2018-08-29 15:50:42

标签: r ggplot2 line

我有一个如下数据框。我需要使用ggplot绘制一个折线图,该折线表示每年(即2014年,2015年等)显示的每一行,并且每年使用不同的颜色。

我无法用下面的代码用直线连接这些点。但是,它每年仅绘制不同颜色的点。这可能很简单,但我无法弄清楚。

library(reshape2)
library(ggplot2)

plot.data <- melt(Table_1, id.vars = 'Day Obs')
ggplot(plot.data, aes(x = `Day Obs`, y = value)) +
  geom_line(mapping = aes(x = `Day Obs`, y = value, colour = variable),size=1.0) +
  geom_point(mapping = aes(x = `Day Obs`, y = value, colour = variable),size=2.3)

表_1:

Day Obs     2014    2015   2016   2017    2018
2018-08-01    NA     NA     NA     NA    1.002    
2018-08-03    NA     0.85   NA     NA       NA
2018-08-06    NA     NA     NA     NA      0.9
2018-08-07    NA     NA    0.78   0.88      NA
.
.

1 个答案:

答案 0 :(得分:0)

问题是观察值和geom_line之间的i值缺失,因此无法连接这些点(因为信息丢失)。可以看到2018年:

library(reshape2)
library(ggplot2)

plot.data <- melt(Table_1, id.vars = 'Day Obs')
plot.data[plot.data$variable == 2018, ]
#       Day Obs variable value
# 17 2018-08-01     2018 1.002
# 18 2018-08-03     2018    NA
# 19 2018-08-06     2018 0.900
# 20 2018-08-07     2018    NA

此处明显缺少2018-08-03的信息。因此,如果我们绘制点,则这些点之间没有连接。

ggplot(plot.data, aes(x = `Day Obs`, y = value, colour = variable)) +
  geom_line(size = 1.0) +
  geom_point(size = 2.3)

enter image description here

您可以删除明确的缺失值,并且可以使用:

ggplot(plot.data[!is.na(plot.data$value), ], 
       aes(x = `Day Obs`, y = value, colour = variable)) +
  geom_line(size = 1.0) +
  geom_point(size = 2.3)

enter image description here

数据

Table_1 <- structure(list(`Day Obs` = structure(c(17744, 17746, 17749, 17750), class = "Date"), 
                          `2014` = c(NA, NA, NA, NA), 
                          `2015` = c(NA, 0.85, NA, NA), 
                          `2016` = c(NA, NA, NA, 0.78), 
                          `2017` = c(NA, NA, NA, 0.88), 
                          `2018` = c(1.002, NA, 0.9, NA)), 
                     row.names = c(NA, -4L), class = "data.frame")