在MNIST集上训练过模型之后,我现在如何将图像分类为两位数?更一般地说,如何训练模型来检测图像上的任意数量的数字?
答案 0 :(得分:1)
有一个名为"对象检测的热点"试图做你想做的事。通常,您可以从任何图像甚至视频中检测任何内容(数字,人物,汽车等)。
最先进的技术大致分为两类:
一个众所周知的实时物体检测方法是YOLO(You Only Look Once),它属于SSD类别,并且具有非常令人印象深刻的实时演示here,让您感受到物体检测。搜索这些方法'名称,你会发现很多满足你需求的示例代码。
如果您只是在寻找数字检测,请查看斯坦福大学House Number Dataset周围的工作。但请注意,这些作品一般来自五年多,而且不一定会超过Faster-RCNN和SSD等一般方法。