我正在尝试根据href
字符串获取td
个标记内的所有td
个链接。我已成功设法获取与BeautifulSoup模块的所有href
链接,但我只对href
标记下td
类包含特定字符串的特定td
链接感兴趣。是否可以使用BeautifulSoup模块或Python中的任何其他模块提取这些?
<td title="" class="pass">
<a href="link info">
<div class="fill"></div>
</a>
</td>
<td title="" class="fail">
<a href="inlk">
<div class="fill"></div>
</a>
</td>
<div class="fill"></div>
</a>
</td>
我有兴趣在href
班级为td
的此网页中获取所有pass
个链接。
答案 0 :(得分:0)
您可以使用CSS selector:
for link in soup.select('td.pass a[href]'):
print link['href']
答案 1 :(得分:0)
from BeautifulSoup import BeautifulSoup,SoupStrainer
import requests
import re
c_link = 'your_link'
r = requests.get(c_link)
data = r.text
soup = BeautifulSoup(data, parseOnlyThese=SoupStrainer("td"))
x = soup.findAll("a")
for tr in x:
links = tr.get('href')
print links
这将从页面中显示的td中获取href。希望这对你有用。