我正在尝试使用滞后,前导和差异变量进行一些面板分析。但是plm
函数不能提供所需的结果,因为它不会遍历个人。我已在网上查看,但是使用pdata.frame()
的以下帖子(Answer_Stack)给出了相同的问题结果。当我在group_by(i)
中dplyr
时,我得到了理想的结果。谁能解释一下发生了什么?
# Variables
i <- c(1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7)
t <- c(2001, 2002, 2003, 2001, 2002, 2003, 2001, 2002, 2003, 2001, 2002, 2003, 2001, 2002, 2003, 2001, 2002, 2003, 2001, 2002, 2003)
y <- c(0.047136, 0.044581, 0.040973, 0.045536, 0.043952, 0.038797, 0.049942, 0.047440, 0.042193, 0.048503, 0.046816, 0.040292, 0.056089, 0.052054, 0.047078, 0.044223, 0.041516, 0.036947, 0.045608, 0.042028, 0.037878)
x <- c(0.32691, 0.33013, 0.32888, 0.40301, 0.40337, 0.40326, 0.29692, 0.29982, 0.29790, 0.30380, 0.30698, 0.30668, 0.27942, 0.28696, 0.28616, 0.31218, 0.31424, 0.31382, 0.34592, 0.34738, 0.34782)
# Create plm dataframe
dta <- data.frame(i, t, y, x)
pdta <- plm.data(dta, indexes = c("i", "t"))
# Create lagged variable with plm
pdta$l.x <- lag(pdta$x) # Does not work
# Create using dplyr
pdta <- pdta %>%
group_by(i) %>%
mutate(lag.x = lag(x))
View(pdta)
回答注意:即使遵循建议的步骤,我也会这样:
> pdta <- pdata.frame(dta, index= c("i", "t"))
> head(cbind(pdta$i, pdta$y, lag(pdta$y)), 10)
[,1] [,2] [,3]
1-2001 1 0.047136 NA
1-2002 1 0.044581 0.047136
1-2003 1 0.040973 0.044581
2-2001 2 0.045536 0.040973
2-2002 2 0.043952 0.045536
2-2003 2 0.038797 0.043952
3-2001 3 0.049942 0.038797
3-2002 3 0.047440 0.049942
3-2003 3 0.042193 0.047440
4-2001 4 0.048503 0.042193
答案 0 :(得分:1)
首先,您没有使用正确的函数将data.frame转换为pdata.frame。 plm.data
返回一个data.frame,可直接用于估算函数,但不直接适用于数据转换函数。请改用pdata.frame
:
pdta <- pdata.frame(dta, index= c("i", "t"))
然后尝试lag
:
head(cbind(pdta$i, pdta$y, lag(pdta$y)), 10)
[,1] [,2] [,3]
1-2001 1 0.047136 NA
1-2002 1 0.044581 0.047136
1-2003 1 0.040973 0.044581
2-2001 2 0.045536 NA
2-2002 2 0.043952 0.045536
2-2003 2 0.038797 0.043952
3-2001 3 0.049942 NA
3-2002 3 0.047440 0.049942
3-2003 3 0.042193 0.047440
4-2001 4 0.048503 NA
或者,您也可以
pdta <- pdata.frame(plm.data(dta, indexes= c("i", "t")))
其次,正如我们在评论中指出的那样,加载dplyr
“覆盖”(掩盖)许多基本R函数,包括你提到的函数。 plm
以这些基本R函数为基础,在其pdata.frame对象上执行所需的操作。正如helix123所提到的,即使加载了dplyr
,您也可以使用plm
来引用plm::<function name>
实现。