使用Selenium WebDriver选择Element后跟文本

时间:2012-07-10 03:12:26

标签: python selenium webdriver selenium-chromedriver

我正在使用Selenium WebDriver和Python绑定来自动执行一些单调的WordPress任务,直到此时它才非常简单。我正在尝试选择一个复选框,但我能识别它的唯一方法是通过它后面的文本。以下是HTML的相关部分:

<li id="product_cat-52">
    <label class="selectit">
       <input value="52" type="checkbox" name="tax_input[product_cat][]" id="in-product_cat-52"> polishpottery
    </label>
</li>

我在脚本中识别此复选框的唯一信息是字符串“polishpottery”。有没有办法选择那个只知道后面的文本的复选框?

3 个答案:

答案 0 :(得分:8)

正如@ sherwin-wu已经说过的那样,你应该找到一种方法来根据id或名称或类别选择你想要的东西(很可能是它的组合)。在你的例子中似乎有足够的可能性,虽然我不知道页面的其余部分通常是什么样的。

说完了,可以按照

这样的XPath选择器执行你想要的操作
driver.find_element_by_xpath("//li/label/input[contains(..,'polishpottery')]")

答案 1 :(得分:0)

正则表达式 - 可能不是最佳解决方案,但它应该有效。

import re

def get_id(str, html_page): # str in this case would be 'polishpottery'
    return re.search(r'<input[^<>]*?type="checkbox"[^<>]*?id="([A-Za-z0-9_ -]*?)"[^<>]*?> ?' + str, html_page).group(1)

id = get_id('polishpottery', html)
checkbox = driver.find_element_by_id(id)
checkbox.toggle()

# Or, more minimallistically:
driver.find_element_by_id(get_id('polishpottery', html)).toggle()

输出:

>>> print(html)
<li id="product_cat-52">
    <label class="selectit">
       <input value="52" type="checkbox" name="tax_input[product_cat][]" id="in-product_cat-52"> polishpottery
    </label>
</li>
>>> get_id('polishpottery', html)
'in-product_cat-52'

答案 2 :(得分:0)

我建议您尝试找到更多方法来选中复选框。例如,您可以使用browser.find_element_by_id(id)根据其标识选择li标记。您也可以使用browser.find_element_by_name(name)基于名称进行选择。

或者,如果你真的不能,你可以使用selenium + BeautifulSoup选择文本。

soup = BeautifulSoup(browser.page_source)
text = soup.find('input', re.compile=" polishpottery")
checkbox = text.parent 
# it might not exactly be parent, but you can play around with
# navigating the tree.

希望这有帮助!