我有一个样品检查。我正在尝试阅读以下内容
a)分支机构名称(即Salwa分部)
b)多哈(即2016年7月1日)
c)支付此支票/订单
d)Riyals
e)QR
f)检查编号
我正在使用Tesseract。由于我无法正确获取信息,因此获取相关信息需要做些什么。
或者任何其他OCR SDK都是针对此目的的。
答案 0 :(得分:0)
手写的所有内容都不会被接受。您只有机会使用已知或类似的字体。在你的情况下,我将分析完整的image / tiff,然后浏览使用Tesseract创建的所有块。
答案 1 :(得分:0)
。
使用此.net包装器可以很好地工作。
https://www.nuget.org/packages/Tesseract/
可以在他的项目页面上找到示例。
在同样的情况下,你必须训练字体。你怎么读这里:
http://www.joyofdata.de/blog/a-guide-on-ocr-with-tesseract-3-03/
对于数字和符号(中间底部)是一个训练有素的字体,我可以通过Google找到tesseract。
答案 2 :(得分:0)
使用tesseract无法检测手写值。虽然用户字体有train tesseract的可能性,但在您的情况下这不会有用,因为支票可能没有相同的字迹。
但是,您仍然可以获取打印字符的值,例如分支名称,检查编号等。