我在Rapidminer中使用xpath时遇到问题。下面是我试图从中提取数据的示例html。我无法获得7001和Calfornia号码。
我使用//h:span[@class='detail-block']//h:/text()
我可以获得“数字:”
然后我尝试//h:span[@class='detail-block']/span//h:/text()
并且什么都没得到。我尝试了一堆这样的变化,但仍然没有提出任何问题。我能够在谷歌电子表格= importXML上工作,但不能使用快速工具。
<div class="information">
<h2 class="underline">Information</h2>
<span class="detail-block"><span class="detail-attribute">Number: </span>
<span>7001</span></span>
<span class="detail-block"><span class="detail-attribute">Location: </span> <span>California</span></span>
答案 0 :(得分:0)
我不明白为什么你的“工作”示例(//h:span[@class='detail-block']//h:/text()
)应该这样做。 h:
是名称空间前缀。 hand必须后跟一个节点或一个属性。
//h:span[@class='detail-block']//text()
将返回任何相关的文本节点以跨越[@ class ='detail-block']:Number: 7001 Location: California
对于“数字:”使用:
//h:span[@class='detail-block'][1]/h:span[1]/text()
对于“7001
//h:span[@class='detail-block'][1]/h:span[2]//text()
对于“加利福尼亚”
//h:span[@class='detail-block'][2]/h:span[2]//text()