如何在面板数据集中识别“群集传输”?

时间:2016-04-19 16:45:11

标签: stata panel-data

我在面板数据集上运行xtreg, fe cluster命令。该小组由数千家公司组成。面板ID定义为nfid,时间ID为year。数据结构就像

nfid year REvalue localcode
20 1998 . 1101
20 1999 . 1101
20 2000 . 1101
21 2003 . 4514
21 2004 . 4514
22 1998 . 1404
22 1999 . 1404
22 2000 . 1404
22 2001 0 1404
22 2002 0 1404
22 2003 0 1404
24 2006 0 3301
24 2007 0 3301
25 1998 . 3213
25 1999 . 3213
25 2000 . 3213
26 2006 0 1502
26 2007 0 1502
27 1998 . 4419
28 2001 0 3101
28 2002 0 3101

localcode是公司所在城市的代码,我们希望将标准错误集中在其上。一般而言,公司在样本期间不会更改其注册地点。但是,在某些情况下,公司确实会经历从一个地方到另一个地方的转移,我称之为“集群转移”#34; (也许有点含糊不清),也许是因为拼写错误或测量错误。

在这种情况下,当我们使用xtreg, fe cluster(localcode)时,它将产生错误消息:

panels are not nested within clusters

我想要的是识别这些"异国情调"公司,并决定我是否可以安全地删除它们,然后正确使用cluster()选项。问题是我不能使用duplicates list nfid localcode,因为有很多nfid-localcode个重复项,只要公司不从一个集群跳转到另一个集群,它们对我们来说都没问题。如何区分有问题的和正常的?

1 个答案:

答案 0 :(得分:0)

@NickCox FAQ的第二种方法是使用duplicates命令:

keep nfid localcode
duplicates drop

* identify the exotic firms
duplicates tag nfid, gen(tag)

* print a list of exotic firm IDs:
list nfid if tag