我尝试对分类数据实施线性模型。 我的数据集由分类预测变量组成,我的目标是定量值。 线性模型有效:
linearMod <- lm(Y~. -1, data=df_filter)
当我提取系数时:
linearMod$coefficients
我有一长串的变量模态系数。 有些模态具有NA值...这很好,我了解。 但是,某些变量模式不会出现在linearMod $系数的输出中。 我可以理解是否将它们设置为“ NA”,但在我的列表中不包含它们对我来说很奇怪。
问题:这种行为是正常现象吗?如果是,这种现象背后的解释是什么?
另一个问题:我读过某个地方,有很多方法可以进行虚拟编码...但是现在找不到了...您是否为此提供了任何网址/链接?
感谢您的回答。