我正在使用bs4来检索来自the metropolitan的图片的网络链接。
url = 'http://www.metmuseum.org/art/collection#!?material=Canvas&showOnly=onDisplay&offset=1780&pageSize=0&sortBy=Relevance&sortOrder=asc&perPage=20'
soup =BeautifulSoup(urlopen(url).read().decode(),'html5lib').encode()
在原始网页上,我想要的数据看起来像这样,它包含我想要的链接。
<figure class="card__standard-image">
<a href="/art/collection/search/459087?sortBy=Relevance&amp;what=Oil+paintings%7cPaintings&amp;od=on&amp;ft=*&amp;offset=0&amp;rpp=20&amp;pos=1">
bs4返回的数据如下所示:
<figure class="card__standard-image">\n <a href="{{ card.url }}">
在我看来,链接被card.url取代,但我不知道如何访问存储在卡中的值。
我尝试了不同的解析器,但无济于事。