我正在使用Gmail API阅读电子邮件,然后尝试提取HTML并将其转换为PDF。
问题:使用我正在使用的代码,html在src属性中包含“ cid”引用,我假设这是引用附加到电子邮件的某些嵌入式图像的id。这会使我的html到pdf转换器崩溃。
<img id="m_8522968232812183394map_0fcc7d4b-a663-4c64-bda9-543e156508f4" src="cid:169b9ad738bfffb7aff2" width="312" height="" border="0" style="clear:both;display:block;height:auto;max-height:358px;max-width:312px;outline:none;text-decoration:none;width:100%">
如何从其中获取HTML并由浏览器解释?
我已经尝试使用email
库,如下面的代码所示,但是它的输出是None
。为什么?
message = service.users().messages().get(userId='me', id=msg_id,
format='raw').execute()
msg_str = base64.urlsafe_b64decode(message['raw'].encode('ASCII')).decode('utf-8')
mime_msg = email.message_from_string(msg_str)
t = mime_msg.get_payload(decode=True)
使用Python 3.6