R中分别有1个热编码训练和测试数据

时间:2016-06-06 22:32:18

标签: r dummy-variable

我需要根据之前100

的长度向data.frame添加data.frame个额外列

例如,我有两个data.frame s XtrainXtestXtrain为1000列,但Xtest只有900列。这种差异是由于单独对XtrainXtest进行1热编码。

如何将这100个缺失的列(全部为0)添加到Xtest?此外,扩充Xtest中的列顺序应与Xtrain相同。

这是我到目前为止所尝试的:

extra = setdiff(names(Xtrain), names(Xtest))

for (e in extra){
    Xtest$e <- 0
}

但是这会在e中添加一列extra而不是相应的条目。

0 个答案:

没有答案