我拥有几年来多个国家的面板数据。
国家/地区:DE,CH,FR,IT和AU
年份:2000年-2015年
对于2005年发生的DE和CH I治疗的正常差异差异回归,可以创建时间假人,所治疗国家的假人和交互作用项。
data$time = ifelse(data$year >= 2005, 1, 0)
data$treated = ifelse(data$country == "DE" | "CH", 1, 0)
data$did = data$time * data$treated
现在,我可以进行差异差异回归,以找出2005年该疗法对DE和CH的平均效果以及年和国家/地区固定的效果。
didreg = lm(y ~ treated + time + did + factor(year)-1 + factor(country)-1, data=data)
或
didreg = plm(y ~ treated + time + did + factor(year) + factor(country), data=data, model = "within")
我的问题是:如果在2008年对FR和IT进行相同的处理,是否是按如下方式进行编码的正确方法:
data$time = ifelse(data$year >= 2005, 1, 0)
data$treated = ifelse(data$country == "DE" | "CH", 1, 0)
data$did = data$time * data$treated
data$time2 = ifelse(data$year >= 2008, 1, 0)
data$treated2 = ifelse(data$country == "FR" | "IT", 1, 0)
data$did2 = data$time2 * data$treated2
didreg2 = lm(y ~ treated + time + did + treated2 + time2 + did2 + factor(year)-1 + factor(country)-1, data=data)
这会给我2005年对DE和CH(did
)的治疗效果以及以后对FR和IT(did2
)的相同治疗效果吗?还是我必须在treated2
中加入DE和CH,因为它们已经接受了治疗?
data$treated2 = ifelse(data$country == "FR" | "IT" | "DE" | "CH", 1, 0)
谢谢您的帮助!
我还实施了固定效果吗?还是有其他方法可以这样做?
从我的lm
回归到plm
有什么区别?我获得了相同的did
值(-0.028)但不同的Adjusted R-suared
lm: Adjusted R-squared: 0.8312
(没有factor()
s lm: Adjusted R-squared: 0.047
后面的-1)
plm: Adjusted R-squared: 0.032