我参与了一个项目,在该项目中,我们需要将所有图像PDF转换为文本PDF(不可搜索到可搜索)。在开始时,我使用了tesseract,两天后我们开始测试abbyy优秀阅读器,我们发现abbyy提供的数据比tesseract更准确。
我使用的代码是link to code
我们已经尝试过Abbyy云OCR SDK,并且成功了。但是我们更有可能使用abbyy优秀的阅读器。 有人可以帮我使用Abbyy Fine Reader转换pdf。
请分享我们可以转换图像PDF的任何其他OCR工具。
非常感谢。 :)