我们可以使用Google为我们发送提醒。我发了10个警报,因为我被邮件“垃圾邮件”,我使用了“每日摘要”选项;我现在每天早上都收到一条包含所有警报的消息。请注意,单独的警报可以选择将警报转换为RSS源,但不能将其组合。
但是,我真的不喜欢这个电子邮件的结构,我更喜欢以某种方式将其视为RSS,我可以用一些RSS阅读器阅读。
我尝试使用Python来收集电子邮件,并使用lxml和bs4来解析它,但它解析起来非常混乱和不一致。
有没有人知道如何创建一个好的RSS源(标题,正文,链接)?
我可以从电子邮件中提取html,对于那些感兴趣的人来说,here对于html很简单。
sp = BeautifulSoup('path/to/html')
for span in sp.findAll('span'):
link = span.find('a')
if link is not None and hasattr(link, 'href'):
print(link.text)
它为我提供了22个链接文本,即使我有17个帖子。
问题在于连链接和文本都没有一致地放置。
这与lxml.html
:
tr = lxml.html.fromstring('path/to/html')
links = tr.xpath('//table/tr/td/div/span/a')
len(links) == 16 # not 17
True
答案 0 :(得分:1)
首先创建警报。然后,您可以选择“交付方式”,然后选择“交付方式”。框。有两个选项可供选择 - 电子邮件或RSS源。