BeautifulSoup找到包含特定单词的链接

时间:2016-07-07 18:08:11

标签: python beautifulsoup

我有这个链接:

<a href="/location/santa-clara/3fce50c4f3f9793d2f503fc145585090">Santa Clara, California</a>

如何使用BeautifulSoup专门查找包含“location”一词的链接?

1 个答案:

答案 0 :(得分:20)

您可以使用简单的"contains" CSS selector

来完成
soup.select("a[href*=location]")

或者,如果只需要匹配一个链接,请使用select_one()

soup.select_one("a[href*=location]")

当然,还有很多其他方法 - 例如,您可以使用find_all()提供href参数,该参数可以具有regular expression值或function

import re

soup.find_all("a", href=re.compile("location"))
soup.find_all("a", href=lambda href: href and "location" in href)