我希望有一个免费的OCR SDK,它可以从扫描的文档文件(.tiff,.png等)中提取文本,包含数据和图像的表,并存储到Office Word文档文件中。
请帮我解决这个问题。我已经使用MODI从图像中提取文本,但无法使用MODI如何提取表格和图像并存储到Office Word文档文件中。
答案 0 :(得分:3)
我不确定开源SDK是否可以解决您的任务。根据您的描述,我发现您需要一个具有文档逻辑结构重建功能的复杂ocr应用程序。如果您正在计划商业软件,可以查看ABBYY FineReader Engine。它有一组document analyzing and reconstruction features,为c#提供api,可以免费试用。免费使用的程序价格不合理,但是对于商业软件而言,ABBYY OCR技术可以为您的产品增添价值,因此请考虑尝试一下。我工作@ ABBYY,如有必要,可以为您提供更多信息。
最好的问候,尼古拉。