pdfminer3从pdf中提取文本,不带空格

时间:2019-11-16 09:34:37

标签: python pdf pdfminer

pdfminer3是用于从pdf提取文本的简单工具。在浏览minimal reproducible example的引用时,面临提取文本中缺少空格的问题。

1 个答案:

答案 0 :(得分:0)

解决方法是指定拉帕姆

from pdfminer3.layout import LAParams
converter = TextConverter(resource_manager, fake_file_handle, laparams=LAParams())