我正在开办一个新的学校项目,我想知道是否有任何资源可用。我已经涉足了一些开源OCR项目,发现Tesseract是一个更准确的(但仍然有点凌乱)。有没有人知道我可以从哪里开始,或者他们是否可以通过Tesseract或任何其他库/示例推动我朝着正确的方向前进。
将相机放在带有序列号的容器上。需要通过图片(实时馈送流的屏幕截图)识别序列号(字符和数字,不同颜色的粗体白色),然后在数据库中查找序列号以获取所需的信息。我很欣赏任何朝着正确方向的推动。
这种语言最好是Java / C ++,因为我真的对这两种编程语言有经验,如果我可以使用这两种语言中的任何一种,它就会让我更容易入手。
答案 0 :(得分:0)
将相机放在带有序列号的容器上。
我认为这意味着您将使用的图像将始终具有相同的尺寸,或多或少。如果没有,您可能必须操纵图像,以使覆盖串行的区域在图像之间变化不大。
将相机放在带有序列号的容器上。那 序列号(字符和数字,不同颜色的粗体白色)
您是否正在对图像进行任何预处理?比如拿任何非白色像素并将其变黑?这将使您的OCR不依赖于图像颜色,从而增加其灵活性。
裁剪图像以发送到OCR,使其仅包含您要解码的数字,这也应该改善OCR的功能。
如果仍然不适合您,您可以尝试按照here所示的方式训练您的Tesseract网络。