使用RTextTool包对数据进行分类

时间:2017-09-15 01:39:56

标签: r sentiment-analysis

我似乎无法弄清楚如何对新数据进行分类。所以,经过一个 模型已经建立,我想用它来分类新数据 进来。
让我说我有一个名为推文的数据集,推文[,1]包含文本推文[,2]是每条推文的极性(正面或负面)

CHARLEN

我现在想要将我创建的不同模型应用于名为newdf的测试数据,其中newdf [,1]表示注释向量

matrix= create_matrix(tweets[,1], language="english",minDocFreq = 2,stripWhitespace = TRUE, removeStopwords=TRUE, removeNumbers=TRUE ) 

container = create_container(matrix, as.numeric(as.factor(tweets[,2])),
                         trainSize=1:190000, testSize=190001:210000,virgin=FALSE)

models = train_models(container, algorithms=c("MAXENT" , "SVM", "RF", "BAGGING", "TREE"))
results = classify_models(container, models)

这是正确的方法吗?

0 个答案:

没有答案