为什么我不能在for循环中直接操作pandas DataFrame?

时间:2018-08-02 07:35:41

标签: python pandas

full_data = [train, test]
for dataset in full_data:
     dataset = pd.get_dummies(dataset)

我正在尝试对火车和测试熊猫DataFrame进行一次热编码。事实证明,火车或测试DataFrame均未更改。我可以在这里得到一些帮助,以了解为什么它不起作用吗?非常感谢!

1 个答案:

答案 0 :(得分:0)

您需要:

full_data = pd.concat([train,test])

df_new = pd.get_dummies(full_data, 
                        columns=categorical_columns, 
                        drop_first=True)