使用Python中的PDF从字体详细信息(样式和大小)中提取文本

时间:2014-02-21 06:20:02

标签: python pdf fonts font-size text-extraction

我希望用Python中的PDF从字体详细信息(样式和大小)中提取文本。

我需要阅读/解析文本内容并获取字体详细信息。请建议。

1 个答案:

答案 0 :(得分:1)

有一个python库。请看一下PDFMiner。

http://www.unixuser.org/~euske/python/pdfminer/index.html

pdftext.py为您提供从pdf中提取的文本,它还为您提供其他信息,如字体和字体大小等。

你可以试试。

注意:不支持Python 3