BeautifulSoup只查找属性包含子字符串的元素?这可能吗?

时间:2015-01-30 17:04:16

标签: python html beautifulsoup html-parsing

我在find_all()代码中呼叫BeautifulSoup。目前这可以为我提供所有图像,但是如果我只想在src中定位具有“占位符”子字符串的图像,我该怎么办呢?

for t in soup.find_all('img'):  # WHERE img.href.contains("placeholder")

1 个答案:

答案 0 :(得分:12)

您可以src关键字参数中的pass a function

for t in soup.find_all('img', src=lambda x: x and 'placeholder' in x):

或者,regular expression

import re

for t in soup.find_all('img', src=re.compile(r'placeholder')):

或者,使用select()

代替find_all()
for t in soup.select('img[src*=placeholder]'):