我在2年的时间内处理包含不同产品日常销售的数据集df。
不幸的是,我缺少观察,以及一些(实际上很多)没有销售的产品的日子(考虑到我检查超过2000种产品的销售情况)。因此,这是我的数据样本,即给定类别产品的每个日期的销售数量。如你所见,' 2014-01-09'和' 2014-01-15'不见了。
date number
2014-01-06 1439
2014-01-07 985
2014-01-08 1202
2014-01-10 1439
2014-01-11 2862
2014-01-12 1542
2014-01-13 990
2014-01-14 562
2014-01-16 1254
2014-01-17 1419
2014-01-18 2667
2014-01-19 1513
无论如何,我创建了一个ts对象:ts <- xts(number,date,by=1)
并简单地绘制它plot(ts,xlab='',ylab='sales')
:
正如您所看到的,有大量缺失的观察结果,特别是在2014年4月/ 7月。
然而,当我使用:'plot.ts(ts)'
时,我得到:
首先,有618个观测值,不到我考虑的2年跨度(729)天。但是在你可以清楚地看到缺失值给出的间隙之前的情节中,就像我有618天的时间而没有遗漏的观察结果。
我的问题是我拥有数百万行和数千种产品的大量数据,因此我希望只在输出上工作而不会在“数字”中引入缺少日期和NAs。柱。
你能帮我解决一下:
提前谢谢你。