标签: python pdf formatting extraction
是否有任何Python库允许从PDF中提取文本,但保留格式(即粗体,斜体,下划线,颜色等)?
我查看了pdfminer等选项,但据我所知,他们只提取原始文本。
pdfminer