从扫描的文档中提取数据c#

时间:2015-01-21 10:08:40

标签: c# pdf ocr text-extraction

我有一个PDF文件,其中包含我们需要导入数据库的数据。 该文件是印刷文本的pdf扫描。 数据结构如下

N° Facture : 45526203   
Date : 01/12/2014
Nom de la société : company

但是这个数据并不总是存在于文档的相同区域。所以我想要一个可以识别这个文件的工具或API。任何建议表示赞赏。

1 个答案:

答案 0 :(得分:0)

ABBYY Cloud OCR SDK可以做到这一点 使用processTextField方法识别文本字段 您可以在ABBYY's website找到详细的文档 如果您需要任何帮助,请不要犹豫,在评论中问我(我为ABBYY工作)。