<a class="cscore_link" name="&lpos=house:schedule:final" href="https://www.url.com-2019-20">
cscore_link
中有html
的多个类,但是name
属性的值不同。我需要获取所有cscore_link
类的href值,其中name
的值具有final
答案 0 :(得分:1)
使用正则表达式。
例如:
import re
from bs4 import BeautifulSoup
html = """<a class="cscore_link" name="&lpos=house:schedule:final" href="https://www.url.com-2019-20"></a>
<a class="cscore_link" name="&lpos=house:schedule" href="https://www.url.com-2019-20"></a>
"""
soup = BeautifulSoup(html, 'html.parser')
print(soup.find_all('a', {'class':'cscore_link', 'name': re.compile(r":final\b")}))
输出:
[<a class="cscore_link" href="https://www.url.com-2019-20" name="&lpos=house:schedule:final"></a>]
答案 1 :(得分:1)
如果您有漂亮汤4.7.1或更高版本,则可以使用以下CSS选择器来查找name
包含final
的内容。
print(soup.select(".cscore_link[name*='final']"))
或者您可以检查名称以final
结尾。
print(soup.select(".cscore_link[name$='final']"))