BeautifulSoup find所有方法都找不到所有的img标签?

时间:2015-01-26 03:46:20

标签: python beautifulsoup

我正在编写一个网络刮刀脚本

picture = soup.find("div", {"id" : "thumbs-top"})
for link in picture.findAll("img"):
    counter += 1

这个计数器结果是327,显然不是这样。我正在抓住这个imgur画廊:http://imgur.com/a/akHsJ?gallery

1 个答案:

答案 0 :(得分:1)

我得到了575。

>>> import requests
>>> from bs4 import BeautifulSoup
>>> r = requests.get('http://imgur.com/a/akHsJ?gallery')
>>> soup = BeautifulSoup(r.text)
>>> picture = soup.find("div", {"id" : "thumbs-top"})
>>> links = picture.findAll("img")
>>> len(links)
575

编辑:在评论中,我们通过使用BeautifulSoup尝试使用不同的html解析器来确定问题已解决。有关详细信息,请参阅this问题。

>>> soup = BeautifulSoup(r.text, 'html.parser')