应用错误收集

PDF Miner处理文本的方式

时间：2018-04-03 10:10:53

标签： python pdfminer

我不确定标题是否清晰，但我会在这里尝试更好地解释。

我有PDF，我需要查看它是否包含一些字符。例如，有：https://imgur.com/a/InsLI

我需要获得包含“contrat n°XXXXX”的行。我从现在开始做的是获取文本，但这就是我所拥有的：

Client
Contrat
Produit

n°XXXXXX
n°XXXXX
XXXXX

但我想要的是这样的：

Client n°XXXX
Contrat n°XXXX
Produit XXXXXXX

有没有办法实现这一目标？

由于

0 个答案:

没有答案