如何通过Selenium从文本节点中提取文本?

时间:2018-09-07 04:25:39

标签: java selenium selenium-webdriver xpath webdriver

我确实有一个HTML代码,我想从那里获取文本,但是几乎文本不在任何HTML标记之内。

HTML

<div class="div-estro">
    <b class="">Your</b> 
    <b class="">ID:</b>&nbsp;3915 
    <b class="">Time Limit:</b>&nbsp;00:19:56 
    <b class="">IP:</b>&nbsp;123.101.59.87 
    <b class="">Membership Period:</b>&nbsp;8 year <br>
    <b class="">CountryID:</b> 78 
    <b class="">Country:</b> US 
    <b class="">State:</b> OH 
    <b class="">City:</b> Akron 
    <b class="">Status:</b> Available 
    <b class="">Maximum Queue:</b> 4 
    <b class=""><br>CountryProxy:</b> 201.250.101.84:3372 
    <b class="">CountryIP:</b> 59.243.44.192 
</div>

我想从CountryIP和CountryProxy获得文本。

期望gettext字符串: 201.250.101.84:3372

期望gettext字符串: 59.243.44.192

我尝试了xpaths:

//div[@class='div-estro']//text()[12]

//div[@class='div-estro']//text()[13]

当我使用Firebug进行评估时,以上xpaths看起来不错。但是,当尝试使用硒获取文本时,出现异常。

2 个答案:

答案 0 :(得分:1)

根据您共享的HTML,它是一个文本节点,其中包含文本 59.243.44.192 ,因此要提取该文本,您可以使用以下解决方案:

WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryIP = ((JavascriptExecutor)driver).executeScript("return arguments[0].lastChild.textContent;", myElement).toString();

更新:

根据您的评论更新,它是一个包含文本 201.250.101.84:3372 的文本节点,因此要提取它,您可以使用以下解决方案:

WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryProxy = ((JavascriptExecutor)driver).executeScript("return arguments[0].childNodes[24].textContent;", myElement).toString();

答案 1 :(得分:1)

您可以使用XPath来获取所需的文本节点,如下所示:

String countryProxy = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryProxy:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();
String countryIP = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryIP:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();

只需更新前b个节点的谓词即可获得所需的文本:

b[.='State:']
b[.='Membership Period:']
...