我有以下数据集。结果变量是State,有3种类型。变量和样本数据如下:
No. Var2 Var3 Var4 Var5 Var6 Var7 Var8 Var9 Var10 Var11 State
297 middle a NA NA 16 working fu $25000 or more more 1 1 NA P
299 middle a NA no 9 working fu $25000 or more sevrl NA 1 0 N
300 middle a no NA 12 working fu $25000 or more every 4 1 0 P
301 foreign NA no 17 working fu $25000 or more never NA 0 0 P
303 middle a no no 19 working fu NA every 1 0 NA P
304 middle a no NA 17 retired $25000 or more every 2 1 0 P
305 foreign no no 17 working fu $25000 or more sevrl 1 1 NA P
306 middle a no no 16 working fu $25000 or more once 1 1 NA V
结果变量有三个类P,N,V。
我必须使用此数据预测未知数据的状态。 我已将R中的数据和构建模型分成一组并与另一组进行核对。
在R中尝试了以下模型:
library(caret)
control <- trainControl(method="repeatedcv", number=10, repeats=3)
xgbGrid <- expand.grid(max_depth = c(1, 3, 5, 9),nrounds = (7:14)*100,eta = 0.1)
ModelXGB <- train(Happy ~ ., data=MerTrain3, method="xgbTree", trControl = control , tuneGrid = xgbGrid)
predXGB <- predict(ModelXGB , newdata=MerTest3, type="raw")
# This gave me accuracy of 0.700297177
我想提高准确性。请在R中建议我使用任何算法来提高这种多类数据的准确性。我尝试过简单的svm,nnet,但没有提高准确性。 还请解释需要对建议模型中的参数进行微调。如果提供了任何链接,我可以共享数据集。 感谢您的期待。