我是新的R用户。我有一个时间序列横截面数据集,虽然我已经找到了在R中延迟时间序列数据的方法,但我还没有找到一种方法来创建滞后的时间序列横截面变量,以便我可以在我的分析中使用它们。
答案 0 :(得分:4)
以下是lag()
函数与zoo
(以及面板系列数据)的使用方法:
> library(plm)
> library(zoo)
> data("Produc")
> dnow <- pdata.frame(Produc)
> x.Date <- as.Date(paste(rownames(t(as.matrix(dnow$pcap))), "-01-01", sep=""))
> x <- zoo(t(as.matrix(dnow$pcap)), x.Date)
> x[1:3,1:3]
ALABAMA ARIZONA ARKANSAS
1970-01-01 15032.67 10148.42 7613.26
1971-01-01 15501.94 10560.54 7982.03
1972-01-01 15972.41 10977.53 8309.01
向前延迟1:
> lag(x[1:3,1:3],1)
ALABAMA ARIZONA ARKANSAS
1970-01-01 15501.94 10560.54 7982.03
1971-01-01 15972.41 10977.53 8309.01
向后滞后1:
> lag(x[1:3,1:3],k=-1)
ALABAMA ARIZONA ARKANSAS
1971-01-01 15032.67 10148.42 7613.26
1972-01-01 15501.94 10560.54 7982.03
正如Dirk所提到的,请注意不同时间序列包中滞后的含义。请注意xts
如何区别对待:
> lag(as.xts(x[1:3,1:3]),k=1)
ALABAMA ARIZONA ARKANSAS
1970-01-01 NA NA NA
1971-01-01 15032.67 10148.42 7613.26
1972-01-01 15501.94 10560.54 7982.03
答案 1 :(得分:4)
对于横截面时间序列数据,包plm非常有用。它具有滞后功能,可以考虑数据的面板特性。
library(plm)
data("Produc", package="plm")
dnow <- pdata.frame(Produc)
head(lag(dnow$pcap,1))
ALABAMA-1970 ALABAMA-1971 ALABAMA-1972 ALABAMA-1973 ALABAMA-1974
NA 15032.67 15501.94 15972.41 16406.26 16762.67
该软件包的一个问题是使用with(或在within或transform中)会给出错误的答案。
head(with(dnow, lag(pcap,1)))
15032.67 15501.94 15972.41 16406.26 16762.67 17316.26
所以要小心。