我正在尝试使用预测数据和实际数据生成混淆矩阵。我收到一个错误,指出水平不相等,并且当两个变量都被读取为因子时,我收到错误。当我检查级别时,我认为问题是因为测试数据具有许多重复的值,因此级别的数量少于唯一的预测值。有没有办法强制测试数据的水平,使其等于预测值?
confusionMatrix(as.factor(sale.pred),as.factor(housing.test.df$SalePrice))
sale.pred
是预测值,housing.test.df$SalePrice
是实际值。如前所述,sale.pred没有重复值,因此其级别等于行数,但是housing.test.df$SalePrice
有重复值,因此其级别数为< n
作为行数。