B的pd.get_dummies编码来自A的pd.get_dummies编码

时间:2019-02-12 13:50:16

标签: python pandas categorical-data one-hot-encoding

(首先,对不起的头衔感到抱歉)

说我有数据框A=pd.get_dummies(dfA),并在A上训练了分类器clf。然后我得到了一个新的数据框dfB,它可能具有某些不存在的某些功能在dfA中。在能够将其解析为B=pd.get_dummies(dfB)之前,我仍然必须clf,但是由于某些功能在B中但它们不在A中,clf会引发错误。

例如名为fruit的功能,其中A在apple,pear,orange中,而B在apple,pear, banana中。
有什么办法可以对B上的A使用相同的“虚拟转换”,还是可以解决该问题的其他任何方式(当然,删除B中有级别但A中没有级别的行)?

0 个答案:

没有答案