Findall标签之间的数据

时间:2016-10-15 00:51:44

标签: python regex parsing rss findall

我试图基本上构建一个Python脚本来打开RSS新闻源,然后将它下载的新闻数据编译成HTML文件,然后将其作为“报纸”阅读。对于学校作业,因此我不能进口像美丽的汤这样的东西。

使用此代码,我可以在一行中提取数据,但是它不会在多个数据库中提取数据,经过一段时间的谷歌搜索后,我无法解决这个问题。

from urllib import urlopen

from re import findall

from webbrowser import open as webopen


url = 'http://ax.itunes.apple.com/WebObjects/MZStoreServices.woa/ws/RSS/topsongs/limit=10/xml' 


web_page_contents = urlopen(url).read()

print(re.findall(r'<item>(.*?)</item>', web_page_contents))

0 个答案:

没有答案