如何为没有类的新数据提供类?
我使用KNN算法,这是用于建模的代码。 (文本分类)
train_set <- sample(1:nrow(dtm.df), 15)
test_set <- (1:nrow(dtm.df))[- train_set]
# Isolate classifier
classifier <- dtm.df[, "class"]
# Create model data and remove "category"
model_data <- dtm.df[,!colnames(dtm.df) %in% "class"]
# Create model: training set, test set, training set classifier
knn.pred <- knn(model_data[train_set, ], model_data[test_set, ],
classifier[train_set], k=5)
我尝试这段代码
newdata <- data.frame(text="bagus sekali")
newdata <- Corpus(VectorSource(newdata))
newdata <- DocumentTermMatrix(newdata)
model = knn(model_data[train_set, ], newdata, classifier[train_set], k =5)
knn中的错误(model_data [train_set,],newdata,classifier [train_set] 、: “测试”和“训练”的暗淡有所不同
我知道暗角有所不同,测试值为37 288,newdata为11。