如何从blogspot.com博客解析所有帖子的网址?

时间:2018-03-28 14:19:09

标签: python parsing feedparser

这篇文章类似于How can I retrieve all posts from a Blogger (blogspot.com) blog?

我做

import feedparser
url = feedparser.parse('https://www.blogger.com/feeds/1020819187099399113/posts/default?max-results=1000')
for x in url.entries:
    print (str(x.link))

我指出max-results=1000

len(url['entries'])
500

那么如何克服这个限制呢?或者是否有其他方法可以解析blogspot.com博客中的所有网址?

1 个答案:

答案 0 :(得分:0)

决定是

url = feedparser.parse('https://www.blogger.com/feeds/1020819187099399113/posts/default?redirect=false&start-index=50&max-results=500')
for x in url.entries:
    print (str(x.link))

限制为500但我们可以申请redirect=false&start-index=50。 50意味着我们从第50个元素开始。所以我们可以传递所有帖子