如何通过bs4 python中的相似字符串查找页面中的特定链接

时间:2019-05-29 20:37:58

标签: python web-scraping beautifulsoup

有没有找到包含此示例字符串Top 100 Club Tracks Vol.1 2019.rar的链接的方法

但是也许链接包含这种类型的字符串

Top_100_Club_Tracks_Vol.1_2019.rar(大写和_)

top 100 club tracks vol.1 2019.rar(小写和空白)

top.100.club.tracks.vol1.2019.rar(小写和加注)

我只是尝试这段代码,却找不到包含特定字符串的链接:

mystr = Top 100 Club Tracks Vol.1 2019.rar

 links = soup_music.find('a', text=Title).findNext("div",{"class":"postContent"}).findAll('a', attrs={'href':re.compile(mystr)})

1 个答案:

答案 0 :(得分:0)

假设它在a标记中,则可以使用* contains运算符,并将或字符串列表传递给select

soup.select('[href*="Top 100 Club Tracks Vol.1 2019.rar"],[href*="top 100 club tracks vol.1 2019.rar"]')

继续添加逗号分隔的变体以进行选择,如上所示。