标签: python python-3.x email pdf pdfminer
我有从邮件转换而来的pdf文档。我想提取“收件人”,“发件人”,“主题”,“正文”。我正在使用pdfminer,但它正在抓取全文。我只想要那些,但要分开。 预先感谢您的帮助。
我已经尝试过使用PYDF2,但是它返回的是乱码而不是文本。因此,我为此使用了PDF Miner。