如何逐步训练天真湾分类器?

时间:2016-11-16 17:56:09

标签: machine-learning bayesian accord.net

使用Accord.NET我创建了一个NaiveBayes分类器。它将基于6组左右的图像处理结果对像素进行分类。我的图像是500万像素,因此50个图像的训练集创建了一组非常大的训练数据。

每个像素6个int数组* 500万像素* 50个图像。

有没有办法逐步训练NaiveBayes分类器,而不是试图将所有数据存储在内存中?每次调用Learn()会多次覆盖旧数据,而不是添加到旧数据中。

1 个答案:

答案 0 :(得分:0)

目前无法使用Accord.NET逐步训练Naive Bayes模型。

然而,由于Naive Bayes所要做的就是尝试将一些分布拟合到您的数据中,并且由于您的数据维度很少,也许您可​​以尝试在数据的子样本上学习您的模型,而不是一下子全部。

当您加载图片以构建训练集时,您可以尝试随机丢弃每张图像中x%的像素。您还可以为x的不同值绘制分类器精度,以找到模型的内存和准确度之间的最佳平衡(提示:对于如此小的模型和大量的训练数据,我希望它不会使即使您丢弃了50%的数据,也会产生很大差异。)