如何对组合的测试数据和训练数据进行热编码,然后再次拆分?

时间:2019-04-02 15:44:55

标签: pandas sklearn-pandas one-hot-encoding

我有单独的测试和训练数据(我不分割一个数据帧),因此,如果我要进行一种热编码,则需要将它们组合然后编码,因为否则会在测试和训练数据中发生不同的编码,我会得到错误的输出。现在我已经合并了数据并进行了一次热编码,但是在再次拆分时遇到了问题

在这里,我想对“ Embarked”列进行编码。训练和测试是数据帧。而且“生存”是火车数据框中的目标,因此我不会在测试数据框中包含此列。我必须根据测试数据帧对此进行预测。

    <form name="frm">
            Enter the temp in Fahrenheit:
            <input type="text" name="txt">
            <input type="text" name="txt">
            <input type="button" value="temperature" onclick="show_temp()">
        </form>

现在,当我尝试再次拆分时,最后三行出现错误。因为在编码后,“ Embarked_”已转换为三列“ Embarked_C”,“ Embarked_Q”,“ Embarked_S”。请告诉我如何再次拆分以获取两个单独的数据帧以进行训练和拆分

0 个答案:

没有答案