我的线性回归模型具有以下因变量和自变量。由于它们的比例不同(有些是其他连续变量),建议我在进行回归之前先取日志并对其进行归一化。
Y X2 X3 (%) X1 (%)
Mean 2.9 24.6 0.009517 230.992248
std 2.3 32.2 0.077092 230.992248
Min 0 1 0 0
Max 8 539 1 1
我有以下问题:
为什么我应该获取日志然后对其进行规范化-而不是仅使用两个数据转换之一?
我应该同时记录和标准化我的Y变量吗?
在练习结束时如何解释我的系数?以及如何使它们对业务受众具有人类理解性?
任何简单的文档参考都非常感谢!