使用Caffe对图像中的手写数字进行分类

时间:2016-12-16 07:41:56

标签: c++ deep-learning caffe

我正在尝试使用来自mnist示例的训练有素的LeNet模型来对给定图像中的数字进行分类。我正在跟踪cpp classification example,因为它读取图像(尽管是ImageNet数据)并对其进行分类。 我对Imagenet中的sysnet文件是什么以及如何用于分类感到困惑?我们还需要Lenet的标签文件来分类手写数字,如果是,如何创建一个以及格式应该如何?

1 个答案:

答案 0 :(得分:1)

caffe本身有一个很好的关于这个主题的教程:http://caffe.berkeleyvision.org/gathered/examples/mnist.html。他们会比我更好地解释这一点。

然而,对于标签,有多种方法可以做到这一点。最常见的是图像只是按文件夹分割。然后1文件夹包含显示数字1的图像,文件夹2显示数字2的图像,依此类推。然后你可以利用它来加载训练数据。

但是,您也可以为每个图像创建标签文件,并将相应的编号写入标签文件。然后,您只需要知道名称模式即可找到标签文件。