下午好,
好吧,我想执行多标签文本分类,因此,我选择MEKA(Weka的扩展名)来执行此任务。但是,我需要将文档转换为单词Vector,我使用GUI Weka但是你知道它只执行一个biary分类,因为我倾向于使用MEKA来执行这个任务, 问题是如何创建一个带有多个标签的arff文件 这是一个例子: 这是文本
在四氢癸烷存在下,在2A℃下向哈维氏弧菌荧光素酶添加FMNH(2)导致形成高度荧光的瞬态物质,其光谱分布与生物发光的光谱分布无法区分。生物发光在1.5 s内达到最大强度,并以复杂的方式衰减,指数分量为10(-1)s(-1),7 x 10(-3)S(-1)。和7 x10(4)s(-1)。
标签是:
“FM”,“Fl”,“Ki”,“Luc”,“Lum”,“时间因素”
我想得到的结果:
@attribute L-class {Luc,Lum,Limb,...}
@attribute F-class {FM,Fl,Foot,...}
@attribute o-class {Ki,TimeFactors,Adult,Aged,...}
@attribute All_words频率
@data
FM,FL,KI,卢克,绥,TimeFactors,2,4,6,8,8,7,4,0,1,2,2 ....
首字母缩写词是标签,数字是文本中出现的每个词的频率。 有人可以帮助我,我会非常感激。