从文本文件生成libsvm格式的数据

时间:2013-02-16 10:49:26

标签: matlab weka libsvm

首先,我的数据预处理非常差。我正在寻找libsvm格式的WebKB数据。后来经过互联网搜索后,我发现了阻塞和停止删除后获得的数据。格式如下,
每行代表一个向量,每个文件中的第一个单词包含类名,后跟一些单词列表,这些单词列表形成由空格分隔的特征。
如何将这样的文本文件转换为lib-svm格式?是否有任何Weka或Matlab工具来构建它?

1 个答案:

答案 0 :(得分:0)

libshorttext1.1是一个python模块,具有用于此目的的实用程序,具有许多额外功能。尝试一下,或者我认为scikit学习包也有这个功能