绘制时间序列,在一定范围内具有缺失值

时间:2016-10-15 14:18:29

标签: r plot ggplot2 time-series

我在2年的时间内处理包含不同产品日常销售的数据集df。

不幸的是,我缺少观察,以及一些(实际上很多)没有销售的产品的日子(考虑到我检查超过2000种产品的销售情况)。因此,这是我的数据样本,即给定类别产品的每个日期的销售数量。如你所见,' 2014-01-09'和' 2014-01-15'不见了。

  date     number
2014-01-06  1439
2014-01-07   985
2014-01-08  1202
2014-01-10  1439
2014-01-11  2862
2014-01-12  1542
2014-01-13   990
2014-01-14   562
2014-01-16  1254
2014-01-17  1419
2014-01-18  2667
2014-01-19  1513

无论如何,我创建了一个ts对象:ts <- xts(number,date,by=1) 并简单地绘制它plot(ts,xlab='',ylab='sales')

1

正如您所看到的,有大量缺失的观察结果,特别是在2014年4月/ 7月。

然而,当我使用:'plot.ts(ts)'时,我得到:

2

首先,有618个观测值,不到我考虑的2年跨度(729)天。但是在你可以清楚地看到缺失值给出的间隙之前的情节中,就像我有618天的时间而没有遗漏的观察结果。

我的问题是我拥有数百万行和数千种产品的大量数据,因此我希望只在输出上工作而不会在“数字”中引入缺少日期和NAs。柱。

你能帮我解决一下:

  1. 在给定的时间范围内绘制系列,如2015-03-04&#39; - &#39; 2016-03-04&#39; 。
  2. 将x标签添加到我的第二个图中,考虑到第一个图中的间隙(我想要729天的跨度,即使我有618个观察值)。
  3. 提前谢谢你。

0 个答案:

没有答案