应用错误收集

下午好，

好吧，我想执行多标签文本分类，因此，我选择MEKA（Weka的扩展名）来执行此任务。但是，我需要将文档转换为单词Vector，我使用GUI Weka但是你知道它只执行一个biary分类，因为我倾向于使用MEKA来执行这个任务，问题是如何创建一个带有多个标签的arff文件这是一个例子：这是文本

在四氢癸烷存在下，在2A℃下向哈维氏弧菌荧光素酶添加FMNH（2）导致形成高度荧光的瞬态物质，其光谱分布与生物发光的光谱分布无法区分。生物发光在1.5 s内达到最大强度，并以复杂的方式衰减，指数分量为10（-1）s（-1），7 x 10（-3）S（-1）。和7 x10（4）s（-1）。

标签是：

“FM”，“Fl”，“Ki”，“Luc”，“Lum”，“时间因素”

我想得到的结果：

@attribute L-class {Luc，Lum，Limb，...}

@attribute F-class {FM，Fl，Foot，...}

@attribute o-class {Ki，TimeFactors，Adult，Aged，...}

@attribute All_words频率

@data

FM，FL，KI，卢克，绥，TimeFactors，2,4,6,8,8,7,4,0,1,2,2 ....

首字母缩写词是标签，数字是文本中出现的每个词的频率。有人可以帮助我，我会非常感激。

如何为多标签文本分类创建ARFF数据集

0 个答案: