使用python regex从RSS提要中翻录某些元素

时间:2015-10-07 23:14:52

标签: python regex rss

我的任务是在python中创建一个程序,该程序从新闻RSS feed的第一篇文章中删除数据,并以不同的格式显示它。在RSS源上发布新文章时,程序必须更新,因此无法进行硬编码。

我已经查看了python regex的所有其他答案,他们都建议使用Beautiful Soup,遗憾的是我除了pythons RE库之外我无法使用任何东西。我遇到的麻烦是使用正则表达式来获取页面上第一篇文章的标题,日期,图片和第一句,而忽略其余部分。

Source code of RSS

1 个答案:

答案 0 :(得分:0)

现在如何执行.py文件?这个问题需要一些工作和方法。就像问一个面包师一样,你怎么烤蛋糕?

我会创建一个名为的.py脚本,reader.py,我会像这样执行它:

C:\Python27\ python reader.py 

基本示例(reader.py):

import re 

names_file = open("file_getting_read.txt", encoding="utf-8")
data = names_file.read()
names_file.close()