标签: r machine-learning large-data
我正在尝试对大约950万个观测数据集运行kNN,SVM和随机森林分析。我正在使用此代码。
svm1 <- svm(usertype ~ ., data = CHbikesTrain, method = 'svmLinear', trControl = train_control, na.action = na.pass)
我被告知数据太大了。如何将其分成块,以便模型不会立即对所有数据运行?
提前致谢!