我正在开发一个自动化项目,要求我识别扫描的pdf(图像)中的文本。我需要在python中编写代码,使用Acrobat Pro中的识别文本功能将整个PDF(扫描)转换为可读的PDF DC。
到目前为止,我已经在python中编写了以下代码:
avDoc = Dispatch("AcroExch.AVDoc")
pdDoc = avDoc.GetPDDoc()
app = Dispatch("AcroExch.App")
app.MenuItemExecute("Cpt:CapturePages")
这会打开pdf并转到包含“识别文本”按钮的屏幕。如何单击该按钮并获得所需的输出?