如何使用xpath选择器从此表格单元格中获取价格?

时间:2012-01-23 17:10:32

标签: xpath domdocument

给定的

<TD ALIGN="LEFT" VALIGN="top" WIDTH="35">&nbsp;</TD><TD ALIGN="LEFT" VALIGN="top" WIDTH="150" STYLE="font-size: 11px; font-family: arial" HEIGHT="65"> <a href="http://www.site.com/page/IDLM/DATA/VALUE/10001600"><B><i>Brand</i></B><BR>Part</a><BR>
$72.00
 </TD>

是否有一个只检索价格的xpath选择器?我可以用

//td/text()

检索

Array
(
    [0] => Â 
    [1] => 

    [2] => Â 
    [3] => Â 
    [4] =>  
    [5] => 
$72.00

    [6] => Â 
)

然后使用正则表达式抛出坏值,但我认为使用正确的xpath选择器会更可靠。

1 个答案:

答案 0 :(得分:1)

有很多方法可以实现这一目标。确定哪个最佳取决于您实际的实际来源输入。根据您提供的示例,我将转向最终的BR元素:

//TD/BR[last()]/following-sibling::text()[1]

此表达式选择文档中任何BR中最后一个TD元素后面的第一个文本节点。请注意,此节点包含前导和尾随空格。使用normalize-space函数包装表达式以删除它们。