标签: machine-learning libsvm
我有两个不同的文件夹,一个用于正面课程,另一个用于负面课程。每个文件夹都包含一组文档。是否有任何实用程序可以将此训练数据集转换为LibSVM格式?
答案 0 :(得分:2)
您可以使用scikit-learn编写python脚本来执行此操作。您可以使用以下实用程序:
load_files加载文本文档,
TfIdfVectorizer在内存矩阵中提取文本要素为scipy.sparse,
scipy.sparse
dump_svmlight使用svmlight格式将生成的稀疏矩阵保存在磁盘上。