如何从中检索名称文档标题?

时间:2019-05-24 09:58:35

标签: pdf pattern-matching

我目前正在尝试寻找一种通过一些变量来搜索pdf文件的方法,例如“审查员姓名”。现在,我想接收这些搜索词的实际值(在这种情况下,为检查员的实际姓名)。在大多数情况下,紧接在我使用的搜索词之后的下一个词就是想要的结果。例如。您可以想象一个带有一些标题的字母,并且在“ Director”(导演)一词下是Directors名称。

到目前为止,我尝试使用PyPDF2使用python进行此操作,但这仅使我可以搜索关键字并验证其是否存在于搜索的pdf中,而无法接收周围的文本。

有人知道怎么做吗?我确信必须有任何现有的解决方案

0 个答案:

没有答案