beautifulsoup以获取样式为“ display:none”的标签

时间:2019-02-25 09:27:16

标签: selenium beautifulsoup webdriver styles

我正在构建网页的搜寻器,并遇到带有以下未显示标签的页面。

<div style="display:none; padding:3px 10px 5px;text-align:center;" id="dialogCookieInfo" title="taiwan high-speed rail" wicket:message="title=bookingdialog_3">
        <div class="JCon">
            <div class="TCon">
                <div class="overDiffText">
                    <div style="text-align: left;">
                        <span> for better user experiences, bla bla <a target="_blank" class="c" style="color:#FF9900;" href="https://www.thsrc.com.tw/tw/Article/ArticleContent/d1fa3bcb-a016-47e2-88c6-7b7cbed00ed5?tabIndex=1">privacy protection</a>。</span>
                    </div>
                </div>
                <div class="action">
                    <table border="0" cellpadding="0" cellspacing="0" align="center">
                      <tr>
                        <td>
                            <input hidefocus="" name="confirm" id="btn-confirm" type="button" class="button_main" value="我同意"/>
                        </td>
                      </tr>
                    </table>
                </div>
            </div>
        </div>
    </div>

通常,此标签将显示在渲染中,并实际上显示在所有其他标签的前面。 实际上,它遮盖了所有其他标签以进行确认或取消答案。 问题在于beautifulsoup无法在我的程序查询中正确返回此标记。 Beautifulsoup刚刚说过,该标签的样式为“ display:none”,没有透露该标签的其他属性及其子元素。 但是我需要这个标签来检查它是否遮盖了所有其他标签。
谁能帮助我回答以下问题?

  1. 如何获取样式为“ display:none”的标签?
  2. 是否有更好的方法来获取那些在渲染后会动态遮盖所有其他标签的标签?
  3. 如果此标签遮盖了所有其他标签,并且我询问是否启用了其他标签,则webdriver将给出什么响应?

非常感谢所有回复。

1 个答案:

答案 0 :(得分:1)

不确定这是否确实是您的需要,但希望至少他能使您朝正确的方向前进。但是,您可以遍历<div>标记并检查其是否具有“样式”属性。如果它具有“样式”属性,则可以检查是否存在“ display:none”。当这些条件成立时,您可以使用这些标签进行任何操作。

html = '''<div style="display:none; padding:3px 10px 5px;text-align:center;" id="dialogCookieInfo" title="taiwan high-speed rail" wicket:message="title=bookingdialog_3">
        <div class="JCon">
            <div class="TCon">
                <div class="overDiffText">
                    <div style="text-align: left;">
                        <span> for better user experiences, bla bla <a target="_blank" class="c" style="color:#FF9900;" href="https://www.thsrc.com.tw/tw/Article/ArticleContent/d1fa3bcb-a016-47e2-88c6-7b7cbed00ed5?tabIndex=1">privacy protection</a>。</span>
                    </div>
                </div>
                <div class="action">
                    <table border="0" cellpadding="0" cellspacing="0" align="center">
                      <tr>
                        <td>
                            <input hidefocus="" name="confirm" id="btn-confirm" type="button" class="button_main" value="我同意"/>
                        </td>
                      </tr>
                    </table>
                </div>
            </div>
        </div>
    </div>'''



import bs4

soup = bs4.BeautifulSoup(html, 'html.parser')

div_display = soup.find_all('div')
for ele in div_display:
    try:
        ele['style']

        if 'display:none' in ele['style']:
            print ('Found "diplay:none"')
            # Do some stuff with this element
        else:
            print ('Did not find "diplay:none"')
    except:
        print ('Element did not have "style" attribute')

输出:

Found "diplay:none"
Element did not have "style" attribute
Element did not have "style" attribute
Element did not have "style" attribute
Did not find "diplay:none"
Element did not have "style" attribute