我有一个按日期销售的数据集,其中日期不是唯一的,并不代表所有日期:我的数据集包含日期(销售日期),数量和总价。这是一个不规则的时间序列。
我想要的是按日期列出的销售数据,每个日期只代表一次,数量和总价格按日期汇总,零没有销售。
我现在有一部分;我可以创建一个包含所有日期的序列:
first_date=as.Date(min(dates))
last_date=as.Date(max(dates))
all_dates=seq(first_date, by=1, to=last_date)
我可以按销售日期汇总销售数据:
quantitybydate=aggregate(quantity, by=list(as.Date(dates)), sum)
但不确定下一步该做什么。如果这是python我会遍历其中一个日期数组,设置或获取相关数量。但这是R我怀疑有更好的方法。
答案 0 :(得分:1)
创建一个以all_dates
为列的数据框,然后使用by变量列作为by.y和all.x = TRUE与quantitybydate
合并。然后将NA替换为0。