我正在编写一个网络刮刀脚本
picture = soup.find("div", {"id" : "thumbs-top"})
for link in picture.findAll("img"):
counter += 1
这个计数器结果是327,显然不是这样。我正在抓住这个imgur画廊:http://imgur.com/a/akHsJ?gallery
答案 0 :(得分:1)
我得到了575。
>>> import requests
>>> from bs4 import BeautifulSoup
>>> r = requests.get('http://imgur.com/a/akHsJ?gallery')
>>> soup = BeautifulSoup(r.text)
>>> picture = soup.find("div", {"id" : "thumbs-top"})
>>> links = picture.findAll("img")
>>> len(links)
575
编辑:在评论中,我们通过使用BeautifulSoup尝试使用不同的html解析器来确定问题已解决。有关详细信息,请参阅this问题。
>>> soup = BeautifulSoup(r.text, 'html.parser')