使用pytesseract从图像生成PDF

时间:2018-12-06 08:18:30

标签: ocr python-tesseract

我正在使用以下代码从图像生成PDF。

off

,PDF变量的类型显示为BYTES。

我如何发布或生成PDF?

2 个答案:

答案 0 :(得分:1)

我找到了答案。只是关闭线程,发布相同。

 f = open("demofile.pdf", "w+b")
 f.write(bytearray(pdf))
 f.close()

demofile.pdf恰好是在工作空间中发布的结果pdf。

答案 1 :(得分:0)

来自Pytesseract-PYPI

获取可搜索的PDF

pdf = pytesseract.image_to_pdf_or_hocr('test.png', extension='pdf')
with open('test.pdf', 'w+b') as f:
    f.write(pdf) # pdf type is bytes by default