谷歌警报每日摘要作为RSS

时间:2015-05-23 10:24:07

标签: python rss beautifulsoup feed google-alerts

我们可以使用Google为我们发送提醒。我发了10个警报,因为我被邮件“垃圾邮件”,我使用了“每日摘要”选项;我现在每天早上都收到一条包含所有警报的消息。请注意,单独的警报可以选择将警报转换为RSS源,但不能将其组合。

但是,我真的不喜欢这个电子邮件的结构,我更喜欢以某种方式将其视为RSS,我可以用一些RSS阅读器阅读。

我尝试使用Python来收集电子邮件,并使用lxml和bs4来解析它,但它解析起来非常混乱和不一致。

有没有人知道如何创建一个好的RSS源(标题,正文,链接)?

我可以从电子邮件中提取html,对于那些感兴趣的人来说,here对于html很简单。

sp = BeautifulSoup('path/to/html')
for span in sp.findAll('span'):
    link = span.find('a')
    if link is not None and hasattr(link, 'href'):
        print(link.text)

它为我提供了22个链接文本,即使我有17个帖子。

问题在于连链接和文本都没有一致地放置。

这与lxml.html

一样接近
tr = lxml.html.fromstring('path/to/html')
links = tr.xpath('//table/tr/td/div/span/a')

len(links) == 16    # not 17
True

1 个答案:

答案 0 :(得分:1)

首先创建警报。然后,您可以选择“交付方式”,然后选择“交付方式”。框。有两个选项可供选择 - 电子邮件或RSS源。