我正在对1990 - 2014年的面板数据集进行回归,例如
log(y_t2)=log(y_t1)+log(gfcf)+log(pg)+log(second)
t2和t1之间的差异为5年,变量gfcf,pg,secondary为5年平均值。
我用来运行回归的代码是
pooling=plm(log(y)~log(lag(y,5))+log(s_k)+log(n1+5),data = Growth,index=c("country", "year"),model = "pooling")
似乎问题是观察期间存在差异,我如何改变这一点使得回归只考虑期间的值t2和t1
t1=1990 t2=1994,t1=1995 t2=2000,...,t1=2010 t2=2014
一个例子就是这样:
Country Year GDP POP PHYS
1 1990 10 1.2 16
1 1991 11 1.1 17
... ... .. ... ..
1 1994 14 1.3 19
... ... ... ... ...
1 2014 20 1.3 19
然后我拿了5年平均人口增长和物质资本,这样我就有了:
pop 1.25 (Average for years 1990-1994)
pop 1.5 (Average for years 1995-1999)
Phys 1.5 (average for years 1990-1994)
等2000-2004,...,2010-2014
和物质资本相同。我的目标是评估回归
Log(GDP(1994))=Log(GDP(1990)+Log(POP)+Log(PHYS)
其中pop和phys是1990-1994时间段的平均值。我希望这会澄清一点。
我认为数据框看起来有点像这样:
Country Year GDP POP PHYS
1 1990-1994 4 1.25 1.5