好吧,首先我不确定这是否是咒骂。如果不是,请告诉我正确的名称。 该页面具有一个div标签,其常规格式为:
<div class="top" data-src="/a/path/to/another/page.html" id="id_random" style="position: absolute; left: 0px; top: 0px;">
我想使用python / bs4检索上面的“ data-src”属性(?)的值,即“ /a/path/to/another/page.html”。
我已经在名为target_div的变量中包含了上面的html代码,并且尝试了以下操作:
target_div.find(id='data-src')
或
target_div.find ('meta', {'name':'data-src'})
或
target_div.find (attrs={'name' : 'data-src'})
请问如何在div中查找“ data-src”及其值?
最好的问候
答案 0 :(得分:2)
您可以尝试以下操作:
from bs4 import BeautifulSoup
target_div = '''<div class="top" data-src="/a/path/to/another/page.html" id="id_random" style="position: absolute; left: 0px; top: 0px;">'''
soup = BeautifulSoup(target_div, 'html.parser')
print soup.find('div', class_='top')['data-src']
结果应为:
/a/path/to/another/page.html