以PDF格式化扫描页面

时间:2017-06-07 15:21:21

标签: python pdf plugins acrobat acrobat-sdk

我正在开发一个自动化项目,要求我识别扫描的pdf(图像)中的文本。我需要在python中编写代码,使用Acrobat Pro中的识别文本功能将整个PDF(扫描)转换为可读的PDF DC。

到目前为止,我已经在python中编写了以下代码:

avDoc = Dispatch("AcroExch.AVDoc")
pdDoc = avDoc.GetPDDoc()
app = Dispatch("AcroExch.App")
app.MenuItemExecute("Cpt:CapturePages")

这会打开pdf并转到包含“识别文本”按钮的屏幕。如何单击该按钮并获得所需的输出?

0 个答案:

没有答案