用于提取html标签的xpath

时间:2013-10-05 03:58:09

标签: javascript html xpath

我想从这个形式的给定html中提取城市和州

<table class="wikitable sortable">
<tr>
<th>Name of City/Town</th>
<th>Name of State</th>
<th>Classification</th>
<th>Population (2001)</th>
<th>Population (2011)</th>
</tr>
<tr>
<td><a href="/wiki/Abhayapuri" title="Abhayapuri">**Abhayapuri**</a></td>
<td><a href="/wiki/Assam" title="Assam">**Assam**</a></td>
<td>TC</td>
<td style="text-align:right;">14,673</td>
<td style="text-align:right;"></td>
</tr>

我试过这样做 $x('//table/tbody/tr/td/a')

但它返回了我不想要的结果(即包含ChileNodes,children,classList,innerHTML和其他元数据的列表)。不知道我做错了什么

1 个答案:

答案 0 :(得分:3)

这个XPath:

$x('//table/tbody/tr/td/a/text()')

将为您提供城市和州:

["**Abhayapuri**", "**Assam**"]

这个XPath将为您带来城市:

$x('//table/tbody/tr/td[1]/a/text()')

["**Abhayapuri**"]

这个XPath会让你获得状态:

$x('//table/tbody/tr/td[2]/a/text()')

["**Assam**"]