如何提取链接到图像" a href" &安培; "类"在使用beautifulsoup的html页面中

时间:2018-01-17 00:36:26

标签: python html beautifulsoup

所以我有几个图像使用相同的代码行来引用页面上的html图像链接:<a href="#" class="sh-mo__image" data-image="http://somejpgimage.jpeg"> 我想仅检索链接,但似乎无法在class之外导航到链接。 有人可以帮忙吗? 我也有&#34; n&#34;我想单独检索的链接数量。

2 个答案:

答案 0 :(得分:2)

你可以用@ D.Chel建议使用list comprehension

>>> links = [x['data-image'] for x in soup.find_all('a', {'class': 'sh-mo__image'})]
>>> links
['http://somejpgimage1.jpeg', 'http://somejpgimage2.jpeg']

答案 1 :(得分:1)

我相信你正在寻找像这样的东西

from bs4 import BeautifulSoup

html = ''' <a href="#" class="sh-mo__image" data-image="http://somejpgimage1.jpeg">
         <a href="#" class="sh-mo__image" data-image="http://somejpgimage2.jpeg"> '''

soup = BeautifulSoup(html,'lxml')

mylinks = []
for link in soup.find_all('a',{'class':'sh-mo__image'}):
    mylinks.append(link['data-image'])