KNN可根据新数据预测班级

时间:2020-01-13 12:09:58

标签: r knn text-classification tf-idf

如何为没有类的新数据提供类?

我使用KNN算法,这是用于建模的代码。 (文本分类)

train_set <- sample(1:nrow(dtm.df), 15)
test_set <- (1:nrow(dtm.df))[- train_set]

# Isolate classifier
classifier <- dtm.df[, "class"]

# Create model data and remove "category"
model_data <- dtm.df[,!colnames(dtm.df) %in% "class"]

# Create model: training set, test set, training set classifier
knn.pred <- knn(model_data[train_set, ], model_data[test_set, ],
classifier[train_set], k=5)

我尝试这段代码

newdata <- data.frame(text="bagus sekali")
newdata <- Corpus(VectorSource(newdata))
newdata <- DocumentTermMatrix(newdata)
model = knn(model_data[train_set, ], newdata, classifier[train_set], k =5)

knn中的错误(model_data [train_set,],newdata,classifier [train_set] 、: “测试”和“训练”的暗淡有所不同

我知道暗角有所不同,测试值为37 288,newdata为11。

0 个答案:

没有答案