我正在研究一个以校园犯罪率为自变量的项目。数据高度偏正。我需要转换数据以实现正常分布以运行OLS。但是,我知道如果我进行日志转换,我将失去犯罪率为0(表示没有犯罪)的所有情况。还有什么其他可能的解决方案?
答案 0 :(得分:1)
虽然你可以通过计算像log(1 + rate)这样的东西来避免丢失案例,但是非负面影响可能会引起麻烦。您可以考虑使用具有日志链接响应比例的伽玛的广义线性模型(分析>广义线性模型)。这也可以解决右倾斜问题。
但请注意,这是在OLS回归中携带正态假设的错误,而不是因变量。