尝试使用XPath获取信息

时间:2011-11-07 17:56:51

标签: xml xpath

最重要的是,谢谢你的时间。

我想从一些网站中选择信息,我对任何类似的表达方式都有疑问。

           <a class="xxxxx">
           <br>
            Hi
           <br>
           <span class="hpn">City</span>
           : Barcelona
           <br>
           <span class="hpn">color</span>
           : Blue
           <br>
           <span class="hpn">Price</span>
           : 50
           <br>

我想用结果巴塞罗那,蓝色,50

选择城市颜色和价格的信息

我在等你的答案!

2 个答案:

答案 0 :(得分:2)

如果没有任何其他信息,包括您对Xpath的了解,我会引导您转到Xpath tutorial

答案 1 :(得分:0)

由于上面的文字是HTML而不是XML(虽然你把它标记为XML),但我认为你不能让它按原样运行。上面的提取不能被解释为格式良好的XML,除非你为<a>标签添加结束标签(假设你只是忘了复制它),而且所有<br>标签都需要自我关闭<br/>以解析此问题。由于我不知道您将尝试使用哪种语言(未指定),也许您的解析器可以正常工作,但我仍然担心XPath查询的结果。但假设它可以工作,像

这样的查询
//a[@class='xxxxx']/span[text()='City']/following-sibling::text()[1]

将返回':Barcelona'(您可以将其子串以删除':'部分)

//a[@class='xxxxx']/span/following-sibling::text()[1]

将在每个span类之后返回第一个兄弟姐妹