使用Selenium从网页中提取文本

时间:2017-09-11 19:44:50

标签: python selenium

我正在尝试使用以下代码(代码段)从网页中提取IP地址。

IPs = driver.find_elements_by_xpath("//span[contains(text(), '10.')]")
print(IPs)

HTML元素如下所示:

<span style="padding: 1px 4px;float:left;">10.20.20.20</span>

检查&gt;&gt;复制Xpath返回:

//*[@id="T1700010887"]/tbody/tr[2]/td[1]/nobr/span

但我所有的代码打印都是通用的selenium代码:

[<selenium.webdriver.remote.webelement.WebElement (session="7885f3a61de714f2cb33
b23d03112ff2", element="0.5496921740104628-2")>, <selenium.webdriver.remote.webe
lement.WebElement (session="7885f3a61de714f2cb33b23d03112ff2", element="0.549692
1740104628-3")>, <selenium.webdriver.remote.webelement.WebElement (session="7885
f3a61de714f2cb33b23d03112ff2", element="0.5496921740104628-4")>]

如何才能打印10.20.20.20的实际IP?

3 个答案:

答案 0 :(得分:3)

find_elements_by_xpath返回一个selenium对象列表。您必须访问每个对象的文本属性。这段代码应该做你想要的:

IPs = driver.find_elements_by_xpath("//span[contains(text(), '10.')]")
IPS = [elem.text for elem in IPs]
print(IPs)

答案 1 :(得分:2)

您需要使用text()

IPs = driver.find_elements_by_xpath("//span[contains(text(), '10.')]/text()")

答案 2 :(得分:2)

使用Selenium的元素查找方法时,您正在检索WebElement对象。你想要的是元素的文本,你可以通过WebElement对象的text属性检索它。此外,find_elements_by_xpath方法返回WebElements列表,因此您需要迭代它:

IPs = driver.find_elements_by_xpath("//span[contains(text(), '10.')]")

for ip in IPs:
    print(ip.text)