如何为多标签文本分类创建ARFF数据集

时间:2016-03-21 19:48:21

标签: text weka arff multilabel-classification

下午好,

好吧,我想执行多标签文本分类,因此,我选择MEKA(Weka的扩展名)来执行此任务。但是,我需要将文档转换为单词Vector,我使用GUI Weka但是你知道它只执行一个biary分类,因为我倾向于使用MEKA来执行这个任务, 问题是如何创建一个带有多个标签的arff文件 这是一个例子: 这是文本

  在四氢癸烷存在​​下,在2A℃下向哈维氏弧菌荧光素酶添加FMNH(2)导致形成高度荧光的瞬态物质,其光谱分布与生物发光的光谱分布无法区分。生物发光在1.5 s内达到最大强度,并以复杂的方式衰减,指数分量为10(-1)s(-1),7 x 10(-3)S(-1)。和7 x10(4)s(-1)。

标签是:

  

“FM”,“Fl”,“Ki”,“Luc”,“Lum”,“时间因素”

我想得到的结果:

  

@attribute L-class {Luc,Lum,Limb,...}

     

@attribute F-class {FM,Fl,Foot,...}

     

@attribute o-class {Ki,TimeFactors,Adult,Aged,...}

     

@attribute All_words频率

     

@data

     

FM,FL,KI,卢克,绥,TimeFactors,2,4,6,8,8,7,4,0,1,2,2 ....

首字母缩写词是标签,数字是文本中出现的每个词的频率。 有人可以帮助我,我会非常感激。

0 个答案:

没有答案