鉴于下面的html,我试图提取“银河系”目前占用的价值。使用路径查询“// a [@ class ='tooltip'] / @ title”只能让我到目前为止。
使用我的查询我可以获得嵌入式HTML。我所追求的是HTML中包含的价值(目前是银河系)..
任何帮助表示感谢,提前谢谢。
<a href="#" class='tooltip' title="<div> <p>Milky Way</p> <p></p>
<table> <colgroup> <col> <col> <col> </colgroup>
<thead>
<tr> <th scope='col'>Boost</th>
<th scope='col'> </th> <th scope='col'>Wibble</th> </tr>
<tbody>
<tr>
<td>Polo</td>
<td>Mints</td>
<td>Spangles</td>
</tr>
<tr>
<td>Skittles</td>
<td>Mars</td>
<td>-Yorkie</td>
</tr>
</tbody>
</table>
</div> ">Sweeties</a>
答案 0 :(得分:0)
这对我有用,虽然我不确定在属性中所有这个未转义的标记是否有效的html
//a[@class='tooltip']/@title
如果您可以控制其结构,请考虑转义它或将其移动到CDATA块,例如:
<![CDATA[
.....
]]>