我似乎无法弄清楚如何对新数据进行分类。所以,经过一个
模型已经建立,我想用它来分类新数据
进来。
让我说我有一个名为推文的数据集,推文[,1]包含文本推文[,2]是每条推文的极性(正面或负面)
CHARLEN
我现在想要将我创建的不同模型应用于名为newdf的测试数据,其中newdf [,1]表示注释向量
matrix= create_matrix(tweets[,1], language="english",minDocFreq = 2,stripWhitespace = TRUE, removeStopwords=TRUE, removeNumbers=TRUE )
container = create_container(matrix, as.numeric(as.factor(tweets[,2])),
trainSize=1:190000, testSize=190001:210000,virgin=FALSE)
models = train_models(container, algorithms=c("MAXENT" , "SVM", "RF", "BAGGING", "TREE"))
results = classify_models(container, models)
这是正确的方法吗?