我正在Stata中对人口普查失业率的决定因素进行分析。以前关于我的主题的一些文献使用了直接的OLS回归,我从这种类型的分析开始,但在我自己进一步阅读之后,我认为广义线性模型更好。这尤其是因为我有兴趣提供人口普查区域的预测值。失业率基于我的回归,我希望这些是适当的限制(在0%和100%之间)。我的失业率包括一些人口普查区的0,所以我需要考虑到这一点。
我的问题是:
Stata的fracreg logit
是否等同于具有logit链接和二项式系列的程序glm
? (我已经阅读了有关在here等几个地方使用glm
版本的信息,但是看到fracreg
是一个新的命令,似乎有同样的目的)。使用robust
时,我可以指定fracreg logit
选项的等效项吗?
如果使用fracreg
,我应该在什么基础上决定使用小数概率(fracreg probit
)或小数logit(fracreg logit
)回归?
一个简单的(可能是无知的)解释问题:我发现上面提到的fracreg
和glm
回归并没有报告R平方值。我可以计算出这些回归的等效量度吗?我的OLS R平方值已经相当高,这对我来说是一个让我放心的点,所以我想看看这些模型是如何比较的(尽管我知道R平方并不是一切!)。
如果使用这些模型还有其他限制或假设(例如OLS BLUE之外的其他假设)我应该记住吗?通过我的OLS回归,我得出了失业率的自然对数(使我的残差更正常,更高的R平方和方便的解释)。我可以对上面的fracreg
或glm
回归做同样的事吗?
自从我正式研究有限因变量以来已经有一段时间了,请原谅我对这些问题的无知。
我已在Statalist here交叉发布此问题。
答案 0 :(得分:0)
这不是Stata特定的,但是至少会查看Paolino's 2001 "Maximum Likelihood Estimation of Models with Beta-Distributed Dependent Variables;“会突出显示为什么OLS提供有偏见的估算器的点亮评论。
嘿,后续:有人做了Stata解决方案,查看“Buckley,Jack.2003。”使用Beta分布式相关变量估计模型:Paolino研究的复制和扩展。“政治分析.11( 2):204-205。“