应用错误收集

PDF文本提取-获取标题字典作为键，段落作为值

时间：2019-09-23 08:08:08

标签： python pdf text extract

here和here提出了相同的问题但是我找不到从pdf文件中仅提取标题的方法。假设从Word文档生成了一个pdf文件，其中包含结构化的标题和段落。现在，我要做的是提取所有标题以及以字典形式写在其中的段落。

有什么方法可以在python中实现此功能，如果可以的话，不胜感激初始指南。谢谢

0 个答案:

没有答案