我确实有一个HTML代码,我想从那里获取文本,但是几乎文本不在任何HTML标记之内。
HTML
<div class="div-estro">
<b class="">Your</b>
<b class="">ID:</b> 3915
<b class="">Time Limit:</b> 00:19:56
<b class="">IP:</b> 123.101.59.87
<b class="">Membership Period:</b> 8 year <br>
<b class="">CountryID:</b> 78
<b class="">Country:</b> US
<b class="">State:</b> OH
<b class="">City:</b> Akron
<b class="">Status:</b> Available
<b class="">Maximum Queue:</b> 4
<b class=""><br>CountryProxy:</b> 201.250.101.84:3372
<b class="">CountryIP:</b> 59.243.44.192
</div>
我想从CountryIP和CountryProxy获得文本。
期望gettext字符串: 201.250.101.84:3372
期望gettext字符串: 59.243.44.192
我尝试了xpaths:
//div[@class='div-estro']//text()[12]
//div[@class='div-estro']//text()[13]
当我使用Firebug进行评估时,以上xpaths看起来不错。但是,当尝试使用硒获取文本时,出现异常。
答案 0 :(得分:1)
根据您共享的HTML,它是一个文本节点,其中包含文本 59.243.44.192 ,因此要提取该文本,您可以使用以下解决方案:
WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryIP = ((JavascriptExecutor)driver).executeScript("return arguments[0].lastChild.textContent;", myElement).toString();
更新:
根据您的评论更新,它是一个包含文本 201.250.101.84:3372 的文本节点,因此要提取它,您可以使用以下解决方案:
WebElement myElement = driver.findElement(By.xpath("//div[@class='div-estro']"));
String myCountryProxy = ((JavascriptExecutor)driver).executeScript("return arguments[0].childNodes[24].textContent;", myElement).toString();
答案 1 :(得分:1)
您可以使用XPath来获取所需的文本节点,如下所示:
String countryProxy = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryProxy:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();
String countryIP = ((JavascriptExecutor)driver).executeScript("return document.evaluate(\"//div[@class='div-estro']/b[.='CountryIP:']/following-sibling::text()\", document, null, XPathResult.ANY_TYPE, null).iterateNext().textContent;").toString();
只需更新前b
个节点的谓词即可获得所需的文本:
b[.='State:']
b[.='Membership Period:']
...