我有单独的测试和训练数据(我不分割一个数据帧),因此,如果我要进行一种热编码,则需要将它们组合然后编码,因为否则会在测试和训练数据中发生不同的编码,我会得到错误的输出。现在我已经合并了数据并进行了一次热编码,但是在再次拆分时遇到了问题
在这里,我想对“ Embarked”列进行编码。训练和测试是数据帧。而且“生存”是火车数据框中的目标,因此我不会在测试数据框中包含此列。我必须根据测试数据帧对此进行预测。
<form name="frm">
Enter the temp in Fahrenheit:
<input type="text" name="txt">
<input type="text" name="txt">
<input type="button" value="temperature" onclick="show_temp()">
</form>
现在,当我尝试再次拆分时,最后三行出现错误。因为在编码后,“ Embarked_”已转换为三列“ Embarked_C”,“ Embarked_Q”,“ Embarked_S”。请告诉我如何再次拆分以获取两个单独的数据帧以进行训练和拆分