应用错误收集

我似乎无法弄清楚如何对新数据进行分类。所以，经过一个模型已经建立，我想用它来分类新数据进来。
让我说我有一个名为推文的数据集，推文[，1]包含文本推文[，2]是每条推文的极性（正面或负面）

CHARLEN

我现在想要将我创建的不同模型应用于名为newdf的测试数据，其中newdf [，1]表示注释向量

matrix= create_matrix(tweets[,1], language="english",minDocFreq = 2,stripWhitespace = TRUE, removeStopwords=TRUE, removeNumbers=TRUE ) 

container = create_container(matrix, as.numeric(as.factor(tweets[,2])),
                         trainSize=1:190000, testSize=190001:210000,virgin=FALSE)

models = train_models(container, algorithms=c("MAXENT" , "SVM", "RF", "BAGGING", "TREE"))
results = classify_models(container, models)

这是正确的方法吗？

使用RTextTool包对数据进行分类

0 个答案: