如何在Python脚本中运行pypdfocr,而不是命令行?
这个问题How to call pypdfocr functions to use them in a python script?接近我想要的答案,但并不能完全实现。
import pypdfocr
from pypdfocr import pypdfocr
from pypdfocr.pypdfocr import PyPDFOCR as pocr
filepath = 'C:/myfolder/myPDF.pdf'
newfile = pocr.run_conversion(filepath)
这会引发错误:
Unbound method run_conversion must be called with PyPDFOCR instance as first argument.
有人可以帮我填写(很明显)缺失的部分吗?
答案 0 :(得分:0)
问题是你试图在没有对象的情况下运行run_conversion。
run_conversion
是类PyPDFOCR
的方法。因此,您需要该类的对象来运行该方法。
创建PyPDFOCR
对象(例如my_ocr
)之后,您应该可以写:
newfile = my_ocr.run_conversion(filepath)
答案 1 :(得分:0)
我成功进行了系统调用。
cmd = "pypdfocr '"+str(file)+"'"
os.system(cmd)