我有一个PDF文件,其中包含我们需要导入数据库的数据。 该文件是印刷文本的pdf扫描。 数据结构如下
N° Facture : 45526203
Date : 01/12/2014
Nom de la société : company
但是这个数据并不总是存在于文档的相同区域。所以我想要一个可以识别这个文件的工具或API。任何建议表示赞赏。
答案 0 :(得分:0)
ABBYY Cloud OCR SDK可以做到这一点 使用processTextField方法识别文本字段 您可以在ABBYY's website找到详细的文档 如果您需要任何帮助,请不要犹豫,在评论中问我(我为ABBYY工作)。