我在R中运行简单的线性模型(Y~X),其中我的预测变量是分类变量(0-10)。然而,这个变量不是正常分布的,并且没有任何可用的转换技术是健康的(例如log,sq等),因为数据不是负面/正面偏斜,而是整个地方。我知道,对于lm,结果变量(Y)必须是正态分布的,但这对于预测变量也是必需的吗?如果是的话,任何有关如何做到这一点的建议都会受到欢迎。
另外,由于我正在查看的数据有两组,患者与对照组(我对组间差异感兴趣,你可以猜到),我是否必须查看数据是否正常分布在两组或两组的整体情况如何? 感谢。
答案 0 :(得分:1)
请参阅上面的@RomanLuštriks评论:预测器的分布方式无关紧要。 (除了多重共线性的问题。)重要的是残差是正常的(并且具有齐次方差)。