一种热编码-如何在Logistic回归中修复匹配的列

时间:2019-04-10 17:25:31

标签: python pandas numpy logistic-regression one-hot-encoding

使用一种热编码,我在Logistic回归中遇到了一些问题。

这是我的情况。

我具有具有分类功能的火车数据,并使用一种热编码进行了编码。

   Limit        Color       Output (Predicted Output)
   4            Red         1
   2            Blue        0
   6            Yellow      1

在对颜色功能使用一种热编码之后,我有2个其他功能(如预期的那样)

Limit       Color_Red   Color_Blue  Color_Yellow    Output
4               1           0            0            1
2               0           1            0            0 
6               0           0            1            1

我已经创建了模型,并使用Logistic回归进行了评估和评分,并且按预期工作正常。

现在我要预测具有以下结构的用户输入数据。

Limit       Color   
6           Red 

并为颜色特征转换了一种热编码,我得到了这种结构。

Limit       Color_Red   
6             1

当我通过传递此输入数据调用modle.predict函数时,我得到以下错误..

X has 2 features per sample; expecting 4 当然,输入数据特征计数与模型输入特征计数不匹配。

如何修复它并感谢您的帮助。

致谢
阿卜杜勒

0 个答案:

没有答案