对MNIST进行培训,检测数字序列?

时间:2017-09-13 23:58:36

标签: machine-learning computer-vision mnist

在MNIST集上训练过模型之后,我现在如何将图像分类为两位数?更一般地说,如何训练模型来检测图像上的任意数量的数字?

1 个答案:

答案 0 :(得分:1)

有一个名为"对象检测的热点"试图做你想做的事。通常,您可以从任何图像甚至视频中检测任何内容(数字,人物,汽车等)。

最先进的技术大致分为两类:

  1. Faster-RCNN,它首先为您感兴趣的对象提出了许多候选窗口,然后检测这些窗口内的实际内容。
  2. SSD,它只扫描图像一次并检测对象,与Faster-RCNN相比,速度更快但不可靠。
  3. 一个众所周知的实时物体检测方法是YOLO(You Only Look Once),它属于SSD类别,并且具有非常令人印象深刻的实时演示here,让您感受到物体检测。搜索这些方法'名称,你会发现很多满足你需求的示例代码。

    如果您只是在寻找数字检测,请查看斯坦福大学House Number Dataset周围的工作。但请注意,这些作品一般来自五年多,而且不一定会超过Faster-RCNN和SSD等一般方法。