我正在尝试创建一个包含从rss feed收集的新闻文章的目录,这意味着每当有一个链接到rss feed中的文章时,我希望将其下载到一个标题为特定文章作为文件名作为文本文件。 这是Python可以帮助我做的事情吗?
感谢您的帮助: - )
答案 0 :(得分:2)
您可以使用feedparser解析RSS Feed,并使用urllib2下载文件。如果您需要解析HTML,请使用BeautifulSoup。如果您遇到任何问题,请发布更具体的问题。
答案 1 :(得分:1)
当然。 BeautifulSoup,lxml,urllib2,urlgrabber。