从PDF部分提取文本,使字符串保持一行

时间:2018-09-15 22:21:55

标签: parsing pdf extractor pdf-scraping

我有一堆PDF文件,我需要从中提取一些信息。 “部分”的文字为“Referências”,如下图所示: enter image description here

我尝试了很多文本提取器工具来完成此任务,但是问题是我需要将字符串保持在同一行中,我不知道我是否可以正确解释这一点,因此让我们来看一个示例:

我不想要那个: enter image description here 我要那个: enter image description here

希望您能理解,对英语感到抱歉。非常感谢。

0 个答案:

没有答案