使用RTextTools时如何保存ID字段

时间:2012-06-16 21:27:58

标签: r machine-learning svm

我正在使用RTextTools来训练和分类来自MySQL表的数据。我有一个名为id的字段,用于标识数据库中的每个文档。但是,使用以下代码后,id字段不再存在。

matrix <- create_matrix(cbind(data$text,data$id),
language="english", removeNumbers=TRUE,
removeSparseTerms=.998)

corpus <- create_corpus(matrix,
as.numeric(data$valid),
trainSize=1:750, testSize=751:1000,
virgin=FALSE)

SVM <- train_model(corpus,"SVM")

SVM_CLASSIFY <- classify_model(corpus, SVM)

如上所述,data$id似乎在此过程中丢失了。知道如何保持ID链接到数据吗?

1 个答案:

答案 0 :(得分:0)

您可以使用cbind命令将ID列添加回输出。例如:

output <- cbind(data$id,SVM_CLASSIFY)