我想预测我的6台具有五大个性特征(OCEAN)的咖啡机之一的“排名”(1-6),我真的不知道哪种算法最适合此任务。任何建议对我都会有很大的帮助。 我曾尝试使用C5.0进行预测,但结果非常糟糕,因此我认为也许有更好的方法或方法来进行预测。也许我做错了,因为我对机器学习和预测还很陌生。
所有“ BFI_”列均为数字列,范围为1-5。
“ Philips”列(飞利浦咖啡机的排名)的数据类型因子为(1-6)。
ind <- sample(2, nrow(dfrandomzied), replace = T, prob = c(0.7, 0.3))
set.seed(100)
train <- df[ind == 1,]
test <- df[ind == 2,]
# Building the model
m1 <- C5.0(train[,1:5], train$Philips)
summary(m1)
# Prediction with Testdaten
p1 <- predict(m1, test)
# Prediction with Testdaten
p1 <- predict(m1, test)
# Auswertung Confusionmatrix
confusionMatrix(p1, test$Philips)
欢迎任何建议:)。预先谢谢。!