在Python脚本中使用pypdfocr库

时间:2017-12-04 17:56:33

标签: python pdf ocr

如何在Python脚本中运行pypdfocr,而不是命令行?

这个问题How to call pypdfocr functions to use them in a python script?接近我想要的答案,但并不能完全实现。

import pypdfocr
from pypdfocr import pypdfocr
from pypdfocr.pypdfocr import PyPDFOCR as pocr

filepath = 'C:/myfolder/myPDF.pdf'

newfile = pocr.run_conversion(filepath)

这会引发错误:

Unbound method  run_conversion must be called with PyPDFOCR instance as first argument.

有人可以帮我填写(很明显)缺失的部分吗?

2 个答案:

答案 0 :(得分:0)

问题是你试图在没有对象的情况下运行run_conversion。

run_conversion是类PyPDFOCR的方法。因此,您需要该类的对象来运行该方法。

创建PyPDFOCR对象(例如my_ocr)之后,您应该可以写:

newfile = my_ocr.run_conversion(filepath)

答案 1 :(得分:0)

我成功进行了系统调用。

cmd = "pypdfocr '"+str(file)+"'"
os.system(cmd)