有什么方法可以使用python从邮件pdf文档中提取“收件人”,“发件人”,“主题”,“正文”?

时间:2019-05-25 16:09:11

标签: python python-3.x email pdf pdfminer

我有从邮件转换而来的pdf文档。我想提取“收件人”,“发件人”,“主题”,“正文”。我正在使用pdfminer,但它正在抓取全文。我只想要那些,但要分开。 预先感谢您的帮助。

我已经尝试过使用PYDF2,但是它返回的是乱码而不是文本。因此,我为此使用了PDF Miner。

0 个答案:

没有答案