Scikit-Learn:Loading&转储多标签SVM光格式

时间:2013-06-28 11:57:53

标签: python scikit-learn libsvm

在scikit-learn中,提供了两个函数来加载和转储SVM ^ light格式的文件:

sklearn.datasets.load_svmlight_file和sklearn.datasets.dump_svmlight_file

文档显示(和函数支持)load_svmlight_file可以加载多标签数据,即目标类别用逗号分隔的位置,而不是单个类别作为目标。 但是,dump_svmlight_file似乎不支持此功能。

我读错了,还是dump_svmlight_file由于某种原因不支持这个?它甚至不可能通过传递带有基于字符串的目标值的y向量来“欺骗它”,因为文件编写器需要浮点值。转储文件代码可以在https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/datasets/svmlight_format.py从第230行到第262行找到。

1 个答案:

答案 0 :(得分:2)

你是对的,dump_svmlight_file目前不支持多标签任务。这是一个遗漏;你可以为它提交一份错误报告,虽然一个好的补丁(拉取请求)会导致更快的行动。

(该模块的作者之一签名。)