我有这个链接:
<a href="/location/santa-clara/3fce50c4f3f9793d2f503fc145585090">Santa Clara, California</a>
如何使用BeautifulSoup专门查找包含“location”一词的链接?
答案 0 :(得分:20)
您可以使用简单的"contains" CSS selector:
来完成soup.select("a[href*=location]")
或者,如果只需要匹配一个链接,请使用select_one()
:
soup.select_one("a[href*=location]")
当然,还有很多其他方法 - 例如,您可以使用find_all()
提供href
参数,该参数可以具有regular expression值或function :
import re
soup.find_all("a", href=re.compile("location"))
soup.find_all("a", href=lambda href: href and "location" in href)