pdf到文本的转换

时间:2019-03-08 05:03:25

标签: python

我想在python中将pdf文本转换为图像,这就是为什么我使用pdf2image库的原因。现在我只能转换一个pdf文件。我必须从文件夹中转换多个文件。  https://i.stack.imgur.com/gnxKK.png

1 个答案:

答案 0 :(得分:1)

This post绝对是您应该阅读的内容。如果您一般不熟悉编程,还应该阅读递归及其基础知识(主要是for循环)。

类似的事情可能会帮助您到达所需的位置,但是您需要为应用程序进行更改。它使用2个不需要手动安装的库(它们是python附带的)os(您可能已经在使用)和glob

import os
from pdf2image import convert_from_path
import glob

path = os.path.dirname(__file__)
for filename in glob.glob(os.path.join(path, '*.pdf')):
    pages = convert_from_path(filename)

Glob Documentation