我正在设计一个RSS feed程序,但是遇到了以下问题:
RSS检查器显然偶尔需要查看提要是否已更新。由于对feedparser中的.etag和.modified项目的支持不高,我至少提出了一个解决方案,可以在纸上找到解决方案。
我的理论是,如果您可以打开一个网页,从中读取到您拥有第一个项目的位置,然后将该项目与当前下载的提要中的第一个条目进行比较,则可以确定提要是否已启动至今为止。
现在,这是我的问题。我不确定如何仅检索网页的一部分。
我尝试使用urlib2.urlopen
,但是时间测试似乎表明它先以某种方式下载页面,然后再打开它。这是错的吗?如果是这样,那就太好了!
如果没有,那么,悲伤的脸。
我想知道是否有人能够为我提供有关如何打开网页并仅逐行下载的答案。
我的主要目标是使用尽可能少的用户互联网数据。
我希望这个问题用词清楚。
谢谢您的帮助。