使用一种热编码,我在Logistic回归中遇到了一些问题。
这是我的情况。
我具有具有分类功能的火车数据,并使用一种热编码进行了编码。
Limit Color Output (Predicted Output)
4 Red 1
2 Blue 0
6 Yellow 1
在对颜色功能使用一种热编码之后,我有2个其他功能(如预期的那样)
Limit Color_Red Color_Blue Color_Yellow Output
4 1 0 0 1
2 0 1 0 0
6 0 0 1 1
我已经创建了模型,并使用Logistic回归进行了评估和评分,并且按预期工作正常。
现在我要预测具有以下结构的用户输入数据。
Limit Color
6 Red
并为颜色特征转换了一种热编码,我得到了这种结构。
Limit Color_Red
6 1
当我通过传递此输入数据调用modle.predict函数时,我得到以下错误..
X has 2 features per sample; expecting 4
当然,输入数据特征计数与模型输入特征计数不匹配。
如何修复它并感谢您的帮助。
致谢
阿卜杜勒