标签: python pdf fonts font-size text-extraction
我希望用Python中的PDF从字体详细信息(样式和大小)中提取文本。
我需要阅读/解析文本内容并获取字体详细信息。请建议。
答案 0 :(得分:1)
有一个python库。请看一下PDFMiner。
http://www.unixuser.org/~euske/python/pdfminer/index.html。
pdftext.py为您提供从pdf中提取的文本,它还为您提供其他信息,如字体和字体大小等。
你可以试试。
注意:不支持Python 3