如何在MATLAB中训练大型数据集进行分类

时间:2017-07-29 06:34:02

标签: matlab classification svm

我有一个大约111 Mb的大特征数据集,用于分类217000个数据点,每个点有1760000个特征点。在MATLAB中使用SVM进行训练时,需要花费很多时间。

如何在MATLAB中处理这些数据。

1 个答案:

答案 0 :(得分:0)

这取决于您正在构建的SVM类型。

根据经验,使用如此大的特征集,您需要查看线性分类器,例如没有/线性内核的SVM,或具有各种正则化的逻辑回归等。

如果您正在使用高斯内核训练SVM,则训练算法具有 O(max(n,d) min (n,d)^2) 复杂度,其中 n 是示例数和 d 功能的数量。在你的情况下,它最终是 O(dn ^ 2),这是非常大的。