OCR(光学字符识别)应该在Web应用程序中使用客户端或服务器端

时间:2016-12-13 10:39:01

标签: asp.net-mvc mongodb azure pdf

我要扫描图像并将其上传到数据库中。我正在使用mongodb来存储文件。需要在文件中搜索,如果我使用OCR,这是可能的。所以我应该在客户端或服务器端使用ocr。我正在使用Microsoft Azure服务器。我考虑过我的步骤。

1)扫描一个或多个文件。

2)将文件存储在mongodb中作为pdf文件。

2.1)OCR扫描图像并将其保存为PDF并将其与OCR结果一起上传到数据库。

3)在数据库中搜索关键字并获取图像ID。

4)以pdf格式将文件加载到查看器中。

所以请建议我实现目标的最佳和最简单的方法。

1 个答案:

答案 0 :(得分:1)

我使用的最佳OCR是ABBY

您应该在服务器端使用OCR,因为客户端会降低性能。
如果您正在开发移动应用程序,则必须在服务器端使用它。此外,您还需要为密钥等OCR SDK维护一些凭据,如果您在服务器端使用它,则可以安全使用。

对于Abby示例代码click here

在Abby click here

注册

您也可以使用开源Tesseract OCR,这是非常好的click here