我试图在R上着名的泰坦尼克号数据集中运行以下ELM示例:
library(elmNN)
dataset <- read.csv(training_data)
formula <- as.factor(Survived) ~ Sex + Age + Pclass + Fare + SibSp + Parch + Embarked
elm_fit <- elmtrain(formula, dataset, nhid=10, actfun="sig")
testset$PredSurvived <- predict(elm_fit, testset, type="class")
训练方法会引发以下错误:
Error in ginv(t(H), tol = sqrt(.Machine$double.eps)) %*% t(T) : requires numeric/complex matrix/vector arguments
据我所知,这是因为算法需要数字数据,而我的属性是离散的。
我的问题是,有没有办法在我的数据集上应用此算法?
答案 0 :(得分:1)
使用model.matrix将因子转换为二进制表示。例如,虹膜中的物种可以生成为model.matrix(~Species,data = iris)