如何使用Tesseract从银行支票中读取信息?

时间:2016-06-10 09:07:32

标签: c# tesseract

我有一个样品检查。我正在尝试阅读以下内容

a)分支机构名称(即Salwa分部)

b)多哈(即2016年7月1日)

c)支付此支票/订单

d)Riyals

e)QR

f)检查编号

我正在使用Tesseract。由于我无法正确获取信息,因此获取相关信息需要做些什么。

或者任何其他OCR SDK都是针对此目的的。

enter image description here

3 个答案:

答案 0 :(得分:0)

手写的所有内容都不会被接受。您只有机会使用已知或类似的字体。在你的情况下,我将分析完整的image / tiff,然后浏览使用Tesseract创建的所有块。

答案 1 :(得分:0)

使用tesseract很容易

使用此.net包装器可以很好地工作。

https://www.nuget.org/packages/Tesseract/

可以在他的项目页面上找到示例。

在同样的情况下,你必须训练字体。你怎么读这里:

http://www.joyofdata.de/blog/a-guide-on-ocr-with-tesseract-3-03/

对于数字和符号(中间底部)是一个训练有素的字体,我可以通过Google找到tesseract。

答案 2 :(得分:0)

使用tesseract无法检测手写值。虽然用户字体有train tesseract的可能性,但在您的情况下这不会有用,因为支票可能没有相同的字迹。

但是,您仍然可以获取打印字符的值,例如分支名称,检查编号等。