应用错误收集

时间：2016-06-10 09:07:32

标签： c# tesseract

我有一个样品检查。我正在尝试阅读以下内容

a）分支机构名称（即Salwa分部）

b）多哈（即2016年7月1日）

c）支付此支票/订单

d）Riyals

e）QR

f）检查编号

我正在使用Tesseract。由于我无法正确获取信息，因此获取相关信息需要做些什么。

或者任何其他OCR SDK都是针对此目的的。

答案 0 :(得分：0)

手写的所有内容都不会被接受。您只有机会使用已知或类似的字体。在你的情况下，我将分析完整的image / tiff，然后浏览使用Tesseract创建的所有块。

答案 1 :(得分：0)

使用tesseract很容易

。

使用此.net包装器可以很好地工作。

可以在他的项目页面上找到示例。

在同样的情况下，你必须训练字体。你怎么读这里：

对于数字和符号（中间底部）是一个训练有素的字体，我可以通过Google找到tesseract。

答案 2 :(得分：0)

使用tesseract无法检测手写值。虽然用户字体有train tesseract的可能性，但在您的情况下这不会有用，因为支票可能没有相同的字迹。

但是，您仍然可以获取打印字符的值，例如分支名称，检查编号等。