我有html,我在这里简化,我需要写一个xPath来获取电话号码。
<td>
<font>
<b>
<font size="2">
<a href="#">Some link</a>
</font>
</b>
<br>
Abc Address
<br>
Country name
<br>
(123) 456-7890
<hr>
A sentence here..
<img src="/images/abc.gif">
</font>
</td>
我可以在锚标记中提取文本,
->filterXPath('//font//b//a')->extract('_text'); //returns some link
如何在最后<br>
代码之后或第一个<hr>
代码之前提取此文本(123)456-7890 ?我访问了this link,但我无法理解。
我也试过这个:
->filterXPath('//font//br[last()]')->extract('_text'); // returns nothing but empty
答案 0 :(得分:2)
选择最后一个br
,然后选择它的第一个文本兄弟:
//font/br[last()]/following-sibling::text()[1]