Question

我正在尝试使用以下代码（代码段）从网页中提取IP地址。

IPs = driver.find_elements_by_xpath("//span[contains(text(), '10.')]")
print(IPs)

HTML元素如下所示：

<span style="padding: 1px 4px;float:left;">10.20.20.20</span>

检查＆gt;＆gt;复制Xpath返回：

//*[@id="T1700010887"]/tbody/tr[2]/td[1]/nobr/span

但我所有的代码打印都是通用的selenium代码：

[<selenium.webdriver.remote.webelement.WebElement (session="7885f3a61de714f2cb33
b23d03112ff2", element="0.5496921740104628-2")>, <selenium.webdriver.remote.webe
lement.WebElement (session="7885f3a61de714f2cb33b23d03112ff2", element="0.549692
1740104628-3")>, <selenium.webdriver.remote.webelement.WebElement (session="7885
f3a61de714f2cb33b23d03112ff2", element="0.5496921740104628-4")>]

如何才能打印10.20.20.20的实际IP？

Answer 1

find_elements_by_xpath返回一个selenium对象列表。您必须访问每个对象的文本属性。这段代码应该做你想要的：

IPs = driver.find_elements_by_xpath("//span[contains(text(), '10.')]")
IPS = [elem.text for elem in IPs]
print(IPs)

Answer 2

您需要使用text()

IPs = driver.find_elements_by_xpath("//span[contains(text(), '10.')]/text()")

Answer 3

使用Selenium的元素查找方法时，您正在检索WebElement对象。你想要的是元素的文本，你可以通过WebElement对象的text属性检索它。此外，find_elements_by_xpath方法返回WebElements列表，因此您需要迭代它：

IPs = driver.find_elements_by_xpath("//span[contains(text(), '10.')]")

for ip in IPs:
    print(ip.text)

使用Selenium从网页中提取文本

3 个答案: