我想在煤气表上执行OCR,以便它可以读取值。我要在上面执行OCR的仪表的一个示例:
在这种情况下,OCR应该返回25539144。
如您所见,这里存在一个问题:仪表周围有很多文字。因此,普通的OCR库在这里无法使用,因为它也会返回周围的文本。
我已经尝试过用物体检测来检测电表,但是似乎唯一运行良好的电表(因为我只有50张照片)是天蓝色的认知服务。问题在于,稍后它应该能够在实时流中检测到它,因此无法使用Web服务。
有人可以在正确的方向帮助我解决这个问题吗?
答案 0 :(得分:1)
如果有关使用颜色的注释对您没有帮助,则可以尝试以下方法:
一种可能的方法可能是训练一个模型(也许是一个NN)以在使用编号周围绘制一个边界框。
您将不得不手动绘制一些方框来提供培训示例。
一旦运行了这种“边界框创建模型”,您就可以裁剪出所有不相关的内容,并且您将获得一个新的训练集,其中包含一些易于学习的示例。
然后您可以尝试在此新数据集上重新训练ocr模型。