Question

我有一个PDF文件，其中包含我们需要导入数据库的数据。该文件是印刷文本的pdf扫描。数据结构如下

N° Facture : 45526203   
Date : 01/12/2014
Nom de la société : company

但是这个数据并不总是存在于文档的相同区域。所以我想要一个可以识别这个文件的工具或API。任何建议表示赞赏。

Answer 1

ABBYY Cloud OCR SDK可以做到这一点使用processTextField方法识别文本字段您可以在ABBYY's website找到详细的文档如果您需要任何帮助，请不要犹豫，在评论中问我（我为ABBYY工作）。