我问一个问题,因为我为期两周的研究开始让我感到非常困惑。
我有一堆图像,我想从这些图像中获取运行时中的数字(Reinforcment Learning中的奖励功能需要它)。事实是,它们对我来说很清楚(我知道对于OCR系统这是完全不同的事情,但这就是为什么我要提供其他图像来显示我在说什么)
我认为这是因为它们很明确。因此,我尝试使用PyTesseract,但在无法解决问题时,我试图研究哪些其他方法可能对我有用。
...这就是我的搜索到此结束的原因,因为试图找出最适合我的问题的方法的两个星期才引发了更多问题。
目前,我认为最好的解决办法是从MNIST / SVNH数据集中创建数字识别模型,但这是否有点过大?我的意思是,图像是标准化的,它们是灰度的,它们很小,数字字体保持不变,所以我认为有一种更简便的方法来修改这些图像/使用不同的OCR方法。
这就是为什么我要问两个问题: