使用gmail API访问电子邮件中的链接

时间:2018-10-03 07:28:05

标签: python-3.x http gmail-api

我正在尝试访问从特定电子邮件地址进入Gmail帐户的电子邮件中的链接。到目前为止,我可以使用GMAIL api从文档https://developers.google.com/gmail/api/v1/reference/users/messages/list

中使用python函数ListMessagesMatchingQuery获取电子邮件ID。

然后从这里,我可以从文档中使用python函数GetMessage检索电子邮件的内容: https://developers.google.com/gmail/api/v1/reference/users/messages/get

但是,内容的格式还不够。我要获取的是电子邮件内容中的链接,以便我可以访问它的HTML页面,然后将其抓取。

谢谢

1 个答案:

答案 0 :(得分:0)

从Gmail提取电子邮件内容后,您可以使用Python的电子邮件解析器库来解析HTML的MIME部分。参见:https://docs.python.org/3.7/library/email.parser.html

使用HTML,然后可以使用Beautifulsoup解析所需内容,请参见:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

在上面的文档页面中,“一项常见任务是提取页面标记中找到的所有URL”,这是代码片段:

Singleton variables: [X]

如果电子邮件解析器库告诉您电子邮件没有HTML组件,则您必须浏览文本以查找链接(例如,查找“ http://”或“ https /”)。