我正在尝试从网站上抓取图片的网址,我尝试针对9gag执行此操作,HTML结构如下:
基于此,在我看来,下面的代码将带我进入容器div的内容。
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen('https://9gag.com')
bs = BeautifulSoup(html, 'lxml')
match = bs.find('body')
match1 = match.find_all('div',attrs={'class': None})
for x in range(0,len(match1)):
print(match1[x].find('div',class_="container"))
但我知道什么都没找到。