(首先,对不起的头衔感到抱歉)
说我有数据框A=pd.get_dummies(dfA)
,并在A上训练了分类器clf
。然后我得到了一个新的数据框dfB
,它可能具有某些不存在的某些功能在dfA
中。在能够将其解析为B=pd.get_dummies(dfB)
之前,我仍然必须clf
,但是由于某些功能在B中但它们不在A中,clf
会引发错误。
例如名为fruit
的功能,其中A在apple,pear,orange
中,而B在apple,pear, banana
中。
有什么办法可以对B上的A使用相同的“虚拟转换”,还是可以解决该问题的其他任何方式(当然,删除B中有级别但A中没有级别的行)?