变量的数据和描述
Picture 1 and Sample unbalanced paneldata
问题
另一个问题是,我的假设是否有效创建平衡面板?从不平衡的paneldata创建平衡是否正确,或者我是否必须使用不平衡面板来创建这样的变量?
所以我的主要问题是如何创建这样的自变量,衡量提供产品的商店数量。至 澄清我的意思,我已经包含了一个固定样本的例子 影响回归,可以解释我尝试的结构 寻找,在图片2 下面:
注意(在图片2 右侧的预期单元格平均值与图片1中的价格差异相同,并用作因变量。它们在数字上回归作为独立变量的公司/商店,这些我有一个问题创建)
我尝试了什么
结束评论
我之前以更加不精确的方式提出了这个问题,我为此给您带来的不便表示歉意。我认为这个问题可能是我在excel中设置错误,因此假人被丢弃了,或者是那种性质的东西。也可能是,我必须使用不平衡集来创建这个自变量,这也可能是一个问题,我试图使用平衡集而不是不平衡集。
答案 0 :(得分:1)
在你的不平衡样本中(正如我们在评论中讨论的那样,平衡样本没有意义)我们首先需要为提供每个ID的商店数量创建一个变量,让我们说我们有相同的数据。你的Picture 1的顶部
egen number_of_firms = rownonmiss(Shop*)
xtset ID year // to use xtreg, we must tell Stata the data are panel
xtreg Price_difference i.number_of_firms
xtreg
是图2中显示的回归。
如果你想将公司变量的数量格式化得更像图2,你可以这样做:
qui levelsof number_of_firms, local(num)
foreach n in `num' {
local lab_def `lab_def' `n' "`n' Firms"
}
label def num_firms `lab_def'
label values number_of_firms num_firms
label var number_of_firms "Number of Firms"
然后运行回归,输出将按照公司标签的数量进行格式化。