我想做一个回归。我的因变量Y是从0到12的离散数字的得分。我有6个独立变量。其中四个在0.4%到40%之间。另外两个自变量不是百分比。其中一个测量年份,介于1.8和67之间。另一个独立变量测量尺寸,介于0.008和5,117之间(非常高)。
我不想使用winsorizing,这就是我决定使用对数的原因。我现在的问题是:当我记录两个不是百分比的自变量时它是否很好,因为它们有很高的值?
这意味着我会使用:reg Y x1 x2 x3 x4 logx5 logx6
为什么我想使用日志是因为我想留意异常值。我没有真正的异常值,但我认为最好使用日志来比较原因。
或者,当一些变量的分布偏斜时,我是否只需要使用log?意义日志会导致较低的偏斜,因此可以适当使用。
提前谢谢你。 卢卡斯