我正在构建网页的搜寻器,并遇到带有以下未显示标签的页面。
<div style="display:none; padding:3px 10px 5px;text-align:center;" id="dialogCookieInfo" title="taiwan high-speed rail" wicket:message="title=bookingdialog_3">
<div class="JCon">
<div class="TCon">
<div class="overDiffText">
<div style="text-align: left;">
<span> for better user experiences, bla bla <a target="_blank" class="c" style="color:#FF9900;" href="https://www.thsrc.com.tw/tw/Article/ArticleContent/d1fa3bcb-a016-47e2-88c6-7b7cbed00ed5?tabIndex=1">privacy protection</a>。</span>
</div>
</div>
<div class="action">
<table border="0" cellpadding="0" cellspacing="0" align="center">
<tr>
<td>
<input hidefocus="" name="confirm" id="btn-confirm" type="button" class="button_main" value="我同意"/>
</td>
</tr>
</table>
</div>
</div>
</div>
</div>
通常,此标签将显示在渲染中,并实际上显示在所有其他标签的前面。
实际上,它遮盖了所有其他标签以进行确认或取消答案。
问题在于beautifulsoup无法在我的程序查询中正确返回此标记。
Beautifulsoup刚刚说过,该标签的样式为“ display:none”,没有透露该标签的其他属性及其子元素。
但是我需要这个标签来检查它是否遮盖了所有其他标签。
谁能帮助我回答以下问题?
非常感谢所有回复。
答案 0 :(得分:1)
不确定这是否确实是您的需要,但希望至少他能使您朝正确的方向前进。但是,您可以遍历<div>
标记并检查其是否具有“样式”属性。如果它具有“样式”属性,则可以检查是否存在“ display:none”。当这些条件成立时,您可以使用这些标签进行任何操作。
html = '''<div style="display:none; padding:3px 10px 5px;text-align:center;" id="dialogCookieInfo" title="taiwan high-speed rail" wicket:message="title=bookingdialog_3">
<div class="JCon">
<div class="TCon">
<div class="overDiffText">
<div style="text-align: left;">
<span> for better user experiences, bla bla <a target="_blank" class="c" style="color:#FF9900;" href="https://www.thsrc.com.tw/tw/Article/ArticleContent/d1fa3bcb-a016-47e2-88c6-7b7cbed00ed5?tabIndex=1">privacy protection</a>。</span>
</div>
</div>
<div class="action">
<table border="0" cellpadding="0" cellspacing="0" align="center">
<tr>
<td>
<input hidefocus="" name="confirm" id="btn-confirm" type="button" class="button_main" value="我同意"/>
</td>
</tr>
</table>
</div>
</div>
</div>
</div>'''
import bs4
soup = bs4.BeautifulSoup(html, 'html.parser')
div_display = soup.find_all('div')
for ele in div_display:
try:
ele['style']
if 'display:none' in ele['style']:
print ('Found "diplay:none"')
# Do some stuff with this element
else:
print ('Did not find "diplay:none"')
except:
print ('Element did not have "style" attribute')
输出:
Found "diplay:none"
Element did not have "style" attribute
Element did not have "style" attribute
Element did not have "style" attribute
Did not find "diplay:none"
Element did not have "style" attribute