硒 - 让所有的孩子成为div,而不是孙子

时间:2015-06-21 12:02:24

标签: python html parsing selenium selenium-webdriver

我试图解析 html 文件。此 html 中有许多嵌套的div。我希望所有孩子 divs ,但不是孙子等。

这是一种模式:

<div class='main_div'>
    <div class='child_1'>
        <div class='grandchild_1'></div>
    </div>
    <div class='child_2'>
        ...
        ...
</div>

所以我要找的命令会返回2个元素 - div是哪个类是&#39; child_1&#39;和&#39; child_2&#39;。

有可能吗?

我尝试使用main_div.find_elements_by_tag_name('div'),但它返回了div中所有嵌套的div。

1 个答案:

答案 0 :(得分:4)

以下是查找类名为“main_div”的div的直接Copyable子项的方法:

div

这里的关键是使用单斜杠,这将使“main_div”非递归查找内的搜索仅直接driver.find_elements_by_xpath('//div[@class="main_div"]/div') 个孩子。

或者,使用CSS selector

div