我有一个“长”格式的时间序列数据数据框,每天有1行/观察。我想将这些数据转换为“宽”格式。每行/观察应具有当前日期和前两天的时间序列值。
为了提供一个具体的例子,我将使用R中可用的空气质量数据。这就是我输入数据框的样子。
> input <- airquality[1:4,c("Month", "Day", "Ozone")]
> input
Month Day Ozone
1 5 1 41
2 5 2 36
3 5 3 12
4 5 4 18
我想转换此输入,使其如下所示。
output <- data.frame(Month = 5, Day = 1:4, Ozone=c(41,36,12,18), Ozone.Prev.1=c(NA,41,36,12), Ozone.Prev.2=c(NA,NA,41,36))
> output
Month Day Ozone Ozone.Prev.1 Ozone.Prev.2
1 5 1 41 NA NA
2 5 2 36 41 NA
3 5 3 12 36 41
4 5 4 18 12 36
有什么好的,干净的方法可以做到这一点?非常感谢提前。
答案 0 :(得分:4)
您可以使用lag
中的zoo
函数,但是以下小函数可以在不使用其他软件包的情况下完成这一操作:
shift_vector = function(vec, n) c(rep(NA, n), head(vec, -n))
output = transform(input, prev_1 = shift_vector(Ozone, 1),
prev_2 = shift_vector(Ozone, 2))
output
Month Day Ozone prev_1 prev_2
1 5 1 41 NA NA
2 5 2 36 41 NA
3 5 3 12 36 41
4 5 4 18 12 36