标签: python pdf text extract
here和here提出了相同的问题 但是我找不到从pdf文件中仅提取标题的方法。假设从Word文档生成了一个pdf文件,其中包含结构化的标题和段落。现在,我要做的是提取所有标题以及以字典形式写在其中的段落。
有什么方法可以在python中实现此功能,如果可以的话,不胜感激初始指南。谢谢