我是R的新手,现在只是探索分类预测。我的数据集包含4列,但最多有660万行。
de.flapdoodle.embed.mongo
工作范围将成为我的班级标签,因此最终预测将是工作范围。供您参考,该列中的Item有10个不同的变量,Job Scope有5个不同的变量。
我尝试了几种算法,例如randomForest,rpart和cforest,但似乎都无法正常工作,并且在执行代码后RStudio将被冻结。这是我使用的代码
DATE |TIME |ITEM |Job scope
Monday |12 |coffee |Police
Monday |13 |bread |Police
Monday |22 |bread |Medical
任何对代码的建议或您可能向我建议的任何指导都将不胜感激。