在面板数据模型

时间:2017-02-20 22:15:10

标签: excel stata

变量的数据和描述

Picture 1 and Sample unbalanced paneldata

  • 图1显示了我使用在同一图像中作为样本提供的不平衡的数据创建的平衡面板数据,其中我有不同年份(YEAR)的多个产品(ID)。对于每种产品,提供给定产品(ID)的商店数量不同。如上所述,这是一个平衡的集合,通过整理相同年份,相同的产品(ID)和相同的商店(由样本不平衡的paneldata中的橙色区域标记)创建。这是一个重要的假设,可能会影响对下述问题的看法。 以下是图1中所示表格的说明:
  • 年份表示产品持续给定产品的期限(ID)
  • Shop 3,Shop 2,Shop 3表示不同公司的特定产品(ID)的不同价格
  • 最小和第二最小值描述了给定年份和产品(ID)的商店,具有该年份的最低和第二低价格。这是计算价格差异所必需的,即**(第二最小值 - 最小值)/(最小值)
  • 第5行(1995年1月1日 - ID 101)给出了一个例子,其中价格差异为(3999-3790)/ 3790 = 5,51%(在图1中)

问题

  • 在我的平衡面板数据中,(图片1),我想使用xtreg函数在STATA中运行固定效果回归,其中因变量是价格差异,以及销售商品的商店数量产品是自变量。这是,所以我可以说,当有1个商店销售,有两个商店销售,以及有三个商店销售时,作为因变量的价格差异如何受到影响。
  • 另一个问题是,我的假设是否有效创建平衡面板?从不平衡的paneldata创建平衡是否正确,或者我是否必须使用不平衡面板来创建这样的变量?

  • 所以我的主要问题是如何创建这样的自变量,衡量提供产品的商店数量。至 澄清我的意思,我已经包含了一个固定样本的例子 影响回归,可以解释我尝试的结构 寻找,在图片2 下面:

注意(在图片2 右侧的预期单元格平均值与图片1中的价格差异相同,并用作因变量。它们在数字上回归作为独立变量的公司/商店,这些我有一个问题创建)

Picture 2

我尝试了什么

  • 我尝试过,在商店里使用虚拟变量,但最终却被淘汰了。图1中提供的数据集是如上所述的平衡数据集,需要运行(我假设)在paneldata上的固定效果回归。

结束评论

我之前以更加不精确的方式提出了这个问题,我为此给您带来的不便表示歉意。我认为这个问题可能是我在excel中设置错误,因此假人被丢弃了,或者是那种性质的东西。也可能是,我必须使用不平衡集来创建这个自变量,这也可能是一个问题,我试图使用平衡集而不是不平衡集。

1 个答案:

答案 0 :(得分:1)

在你的不平衡样本中(正如我们在评论中讨论的那样,平衡样本没有意义)我们首先需要为提供每个ID的商店数量创建一个变量,让我们说我们有相同的数据。你的Picture 1的顶部

egen number_of_firms = rownonmiss(Shop*)
xtset ID year // to use xtreg, we must tell Stata the data are panel
xtreg Price_difference i.number_of_firms

xtreg是图2中显示的回归。

如果你想将公司变量的数量格式化得更像图2,你可以这样做:

qui levelsof number_of_firms, local(num)
foreach n in `num' {
    local lab_def `lab_def' `n' "`n' Firms"

}
label def num_firms `lab_def'
label values number_of_firms num_firms
label var number_of_firms "Number of Firms"

然后运行回归,输出将按照公司标签的数量进行格式化。