我在find_all()
代码中呼叫BeautifulSoup
。目前这可以为我提供所有图像,但是如果我只想在src
中定位具有“占位符”子字符串的图像,我该怎么办呢?
for t in soup.find_all('img'): # WHERE img.href.contains("placeholder")
答案 0 :(得分:12)
您可以src
关键字参数中的pass a function:
for t in soup.find_all('img', src=lambda x: x and 'placeholder' in x):
import re
for t in soup.find_all('img', src=re.compile(r'placeholder')):
或者,使用select()
:
find_all()
for t in soup.select('img[src*=placeholder]'):