PDF文本提取-获取标题字典作为键,段落作为值

时间:2019-09-23 08:08:08

标签: python pdf text extract

herehere提出了相同的问题 但是我找不到从pdf文件中仅提取标题的方法。假设从Word文档生成了一个pdf文件,其中包含结构化的标题和段落。现在,我要做的是提取所有标题以及以字典形式写在其中的段落。

有什么方法可以在python中实现此功能,如果可以的话,不胜感激初始指南。谢谢

0 个答案:

没有答案