标签: parsing pdf extractor pdf-scraping
我有一堆PDF文件,我需要从中提取一些信息。 “部分”的文字为“Referências”,如下图所示:
我尝试了很多文本提取器工具来完成此任务,但是问题是我需要将字符串保持在同一行中,我不知道我是否可以正确解释这一点,因此让我们来看一个示例:
我不想要那个: 我要那个:
希望您能理解,对英语感到抱歉。非常感谢。