无法在python selenium中按类名选择html元素

时间:2017-12-19 04:19:15

标签: python selenium html-content-extraction

我试图从以下html代码的最后一行选择我需要这个文字,到目前为止还没有成功:

# all lines also tested without .text suffix
    text1 = driver.find_element_by_class_name("display-table-cell.b-text_copy-2.
                                              b-text_weight-bold").text
    text2 = driver.find_element_by_class_name("warn").text 
    text3 = driver.find_element_by_class_name("col.xs12").text
    text4 = driver.find_element_by_class_name("display-table-cell").text
    text5 = driver.find_element_by_xpath("//*[contains(@text='I NEED THIS TEXT')]")

INPUT 我通过以下方法失败了:

text1: Message: Unable to locate element: .display-table-cell.b-text_copy-2.b-text_weight-bold
text2: Message: Unable to locate element: .warn
text3: Message: Unable to locate element: .col.xs12
text4: Message: Unable to locate element: .display-table-cell
text5: Message: Given xpath expression "//*[contains(@text='I NEED THIS TEXT')]" is invalid: [Exception... "<no message>"  nsresult: "0x8060000d (<unknown>)"  location: "JS frame :: chrome://marionette/content/element.js :: element.findByXPath :: line 355"  data: no]

输出

{{1}}

我做了一些根本错误的事情吗?如何选择我需要这个文本并将其打印到控制台?

2 个答案:

答案 0 :(得分:-1)

我们的主要目标是从以下节点中提取 I NEED THIS TEXT 文本:

<div> I NEED THIS TEXT <a href=https://somelink/contact.html target=_blank>contact us</a>.</div>

现在根据您的代码试用,您尝试使用class_name display-table-cell.b-text_copy-2.b-text_weight-bold warn { {1}} col.xs12 display-table-cell xpath 。通过这些//*[contains(@text='I NEED THIS TEXT')],您还没有达到包含预期文字的确切 class_name 。因此,我们必须构建 Node xpath 来模拟 cssSelector 并覆盖直到文本所在的预期DOM标记。

因此,要从给定html的最后一行打印 <div> 到控制台,您可以使用以下代码块:

I NEED THIS TEXT

控制台输出:

my_string = driver.find_element_by_xpath("//div[ancestor::div[contains(@class, 'display-table-cell b-text_copy-2 b-text_weight-bold')]]").get_attribute("innerHTML")                    
my_text = my_string.split("contact")
print(my_text[0])

答案 1 :(得分:-1)

主要问题是您主要使用CSS选择器而不是类名。 .find_element_by_class_name()专门用于单个类名。如果要使用CSS选择器,则需要使用.find_element_by_css_selector()。您使用的大多数CSS选择器实际上并不是您想要的DIV。没有链接到页面或更多HTML但很难判断,但尝试这些。

CSS选择器

div.display-table-cell.b-text_copy-2.b-text_weight-bold > div

的XPath

//div[contains(.,'I NEED THIS TEXT')]
//a[.='contact us']/..

您将遇到的一个问题是,包含您想要的文本的DIV也包含&#34;联系我们。&#34;所以如果你不想把它作为最后一个字符串的一部分,你需要将其删除。