我尝试在Winconsin乳腺癌数据集中使用R中的glm实施逻辑回归。我分析了数据集,发现 wbc $ V7 包含缺失值。我使用Hmisc软件包估算了缺失的值,并使用glm进行了逻辑回归
E_WARNING
当wbc数据帧只有V1,V2,V3,V4,V5,V6,V7列时,为什么输出中包含V71,V710,V72,V73,V74,V75,V76,V77,V78和V79的系数V8,V9,V10?
答案 0 :(得分:2)
如果V7是一个因素,则在应用glm时可能会自动对其进行虚拟编码。这样一来,您的因子的每个类别都会有一个系数。
答案 1 :(得分:0)
您应该将变量v7更改为数字,因为这是因子,所以您将获得V7列中所有值的结果。将其更改为数字将解决您的问题。
希望这会有所帮助