PDF Miner处理文本的方式

时间:2018-04-03 10:10:53

标签: python pdfminer

我不确定标题是否清晰,但我会在这里尝试更好地解释。

我有PDF,我需要查看它是否包含一些字符。例如,有:https://imgur.com/a/InsLI

我需要获得包含“contrat n°XXXXX”的行。我从现在开始做的是获取文本,但这就是我所拥有的:

Client
Contrat
Produit

n°XXXXXX
n°XXXXX
XXXXX

但我想要的是这样的:

Client n°XXXX
Contrat n°XXXX
Produit XXXXXXX

有没有办法实现这一目标?

由于

0 个答案:

没有答案