我需要训练一个可以对文本数据执行多标签多类分类的模型。
我目前正在尝试使用R中的mlr包,按照此链接中的说明进行操作 -
Multilabel Classification (using mlr R package)
1)是否有推荐的其他套餐?
2)否则,我被困在这个地方(按照上面提到的文章中的指示)
classify <- getTaskData(dtmDf) ## dtmDf is my dtm converted to dataframe form
&#39;分类&#39;是NULL
任何帮助/指示都将不胜感激。
感谢。
更新: - 试图创建“任务”&#39;对象。代码如下 -
dtm <- DocumentTermMatrix(docs)
mat <- as.matrix(dtm)
mat <- cbind(mat,data$Label)
dtmDf <- as.data.frame(mat)
target <- unique(dtmDf[,2628]) %>% as.character() %>% sort()
classify.task = makeMultilabelTask(id = "classif", data = dtmDf, target =target)
面对以下错误 -
makeSupervisedTask出错(&#34;多标记&#34;,数据,目标,权重,阻塞): 数据的列名称不包含目标var:10
解决
在获得所需格式的输入数据框后,我能够训练它,类似于教程链接中的酵母数据,该数据作为makeMultilabelTask()函数的输入提供