所以我有几个图像使用相同的代码行来引用页面上的html图像链接:<a href="#" class="sh-mo__image" data-image="http://somejpgimage.jpeg">
我想仅检索链接,但似乎无法在class
之外导航到链接。
有人可以帮忙吗?
我也有&#34; n&#34;我想单独检索的链接数量。
答案 0 :(得分:2)
你可以用@ D.Chel建议使用list comprehension。
>>> links = [x['data-image'] for x in soup.find_all('a', {'class': 'sh-mo__image'})]
>>> links
['http://somejpgimage1.jpeg', 'http://somejpgimage2.jpeg']
答案 1 :(得分:1)
我相信你正在寻找像这样的东西
from bs4 import BeautifulSoup
html = ''' <a href="#" class="sh-mo__image" data-image="http://somejpgimage1.jpeg">
<a href="#" class="sh-mo__image" data-image="http://somejpgimage2.jpeg"> '''
soup = BeautifulSoup(html,'lxml')
mylinks = []
for link in soup.find_all('a',{'class':'sh-mo__image'}):
mylinks.append(link['data-image'])