使用R中的mlr包进行多标签文本分类

时间:2016-03-31 11:59:03

标签: multilabel-classification mlr

我需要训练一个可以对文本数据执行多标签多类分类的模型。

我目前正在尝试使用R中的mlr包,按照此链接中的说明进行操作 -

Multilabel Classification (using mlr R package)

1)是否有推荐的其他套餐?

2)否则,我被困在这个地方(按照上面提到的文章中的指示)

classify <-  getTaskData(dtmDf) ## dtmDf is my dtm converted to dataframe   form

&#39;分类&#39;是NULL

任何帮助/指示都将不胜感激。

感谢。

更新: - 试图创建“任务”&#39;对象。代码如下 -

dtm <- DocumentTermMatrix(docs) 
mat <- as.matrix(dtm)
mat <- cbind(mat,data$Label)

dtmDf <- as.data.frame(mat)
target <- unique(dtmDf[,2628]) %>% as.character() %>% sort()

classify.task = makeMultilabelTask(id = "classif", data = dtmDf, target =target)

面对以下错误 -

makeSupervisedTask出错(&#34;多标记&#34;,数据,目标,权重,阻塞):   数据的列名称不包含目标var:10

解决

在获得所需格式的输入数据框后,我能够训练它,类似于教程链接中的酵母数据,该数据作为makeMultilabelTask​​()函数的输入提供

0 个答案:

没有答案