我的任务是在python中创建一个程序,该程序从新闻RSS feed的第一篇文章中删除数据,并以不同的格式显示它。在RSS源上发布新文章时,程序必须更新,因此无法进行硬编码。
我已经查看了python regex的所有其他答案,他们都建议使用Beautiful Soup,遗憾的是我除了pythons RE库之外我无法使用任何东西。我遇到的麻烦是使用正则表达式来获取页面上第一篇文章的标题,日期,图片和第一句,而忽略其余部分。
答案 0 :(得分:0)
现在如何执行.py文件?这个问题需要一些工作和方法。就像问一个面包师一样,你怎么烤蛋糕?
我会创建一个名为的.py脚本,reader.py,我会像这样执行它:
C:\Python27\ python reader.py
基本示例(reader.py):
import re
names_file = open("file_getting_read.txt", encoding="utf-8")
data = names_file.read()
names_file.close()