我试图从以下html代码的最后一行选择我需要这个文字,到目前为止还没有成功:
# all lines also tested without .text suffix
text1 = driver.find_element_by_class_name("display-table-cell.b-text_copy-2.
b-text_weight-bold").text
text2 = driver.find_element_by_class_name("warn").text
text3 = driver.find_element_by_class_name("col.xs12").text
text4 = driver.find_element_by_class_name("display-table-cell").text
text5 = driver.find_element_by_xpath("//*[contains(@text='I NEED THIS TEXT')]")
INPUT 我通过以下方法失败了:
text1: Message: Unable to locate element: .display-table-cell.b-text_copy-2.b-text_weight-bold
text2: Message: Unable to locate element: .warn
text3: Message: Unable to locate element: .col.xs12
text4: Message: Unable to locate element: .display-table-cell
text5: Message: Given xpath expression "//*[contains(@text='I NEED THIS TEXT')]" is invalid: [Exception... "<no message>" nsresult: "0x8060000d (<unknown>)" location: "JS frame :: chrome://marionette/content/element.js :: element.findByXPath :: line 355" data: no]
输出:
{{1}}
我做了一些根本错误的事情吗?如何选择我需要这个文本并将其打印到控制台?
答案 0 :(得分:-1)
我们的主要目标是从以下节点中提取 I NEED THIS TEXT
文本:
<div> I NEED THIS TEXT <a href=https://somelink/contact.html target=_blank>contact us</a>.</div>
现在根据您的代码试用,您尝试使用class_name
display-table-cell.b-text_copy-2.b-text_weight-bold
, warn
, { {1}} , col.xs12
和display-table-cell
为 xpath
。通过这些//*[contains(@text='I NEED THIS TEXT')]
,您还没有达到包含预期文字的确切 class_name
。因此,我们必须构建 Node
或 xpath
来模拟 cssSelector
并覆盖直到文本所在的预期DOM
标记。
因此,要从给定html的最后一行打印 <div>
到控制台,您可以使用以下代码块:
I NEED THIS TEXT
控制台输出:
my_string = driver.find_element_by_xpath("//div[ancestor::div[contains(@class, 'display-table-cell b-text_copy-2 b-text_weight-bold')]]").get_attribute("innerHTML")
my_text = my_string.split("contact")
print(my_text[0])
答案 1 :(得分:-1)
主要问题是您主要使用CSS选择器而不是类名。 .find_element_by_class_name()
专门用于单个类名。如果要使用CSS选择器,则需要使用.find_element_by_css_selector()
。您使用的大多数CSS选择器实际上并不是您想要的DIV
。没有链接到页面或更多HTML但很难判断,但尝试这些。
CSS选择器
div.display-table-cell.b-text_copy-2.b-text_weight-bold > div
的XPath
//div[contains(.,'I NEED THIS TEXT')]
//a[.='contact us']/..
您将遇到的一个问题是,包含您想要的文本的DIV
也包含&#34;联系我们。&#34;所以如果你不想把它作为最后一个字符串的一部分,你需要将其删除。