在快速矿工中使用xpath查询的麻烦

时间:2013-06-20 06:43:48

标签: xpath rapidminer

我在Rapidminer中使用xpath时遇到问题。下面是我试图从中提取数据的示例html。我无法获得7001和Calfornia号码。

我使用//h:span[@class='detail-block']//h:/text()我可以获得“数字:” 然后我尝试//h:span[@class='detail-block']/span//h:/text()并且什么都没得到。我尝试了一堆这样的变化,但仍然没有提出任何问题。我能够在谷歌电子表格= importXML上工作,但不能使用快速工具。

<div class="information">
<h2 class="underline">Information</h2>
<span class="detail-block"><span class="detail-attribute">Number:&nbsp;</span>         
<span>7001</span></span>
<span class="detail-block"><span class="detail-attribute">Location:&nbsp;</span> <span>California</span></span>

1 个答案:

答案 0 :(得分:0)

我不明白为什么你的“工作”示例(//h:span[@class='detail-block']//h:/text())应该这样做。 h:是名称空间前缀。 hand必须后跟一个节点或一个属性。

//h:span[@class='detail-block']//text()将返回任何相关的文本节点以跨越[@ class ='detail-block']:Number: 7001 Location: California

对于“数字:”使用:
   //h:span[@class='detail-block'][1]/h:span[1]/text()

对于“7001   //h:span[@class='detail-block'][1]/h:span[2]//text()

对于“加利福尼亚”

//h:span[@class='detail-block'][2]/h:span[2]//text()