Xpath只选择一些tr

时间:2016-04-25 22:55:18

标签: html xpath web-scraping

我有像这样的HTML代码

<table>
<tr>
    <th><a href="example.html" title="exemple_title_th"></a><th>
    <td></td>
    <td></td>       
<tr>
<tr>
    <td><a href="example2.html" title="exemple_title_td"></a><td>
    <td></td>
    <td></td>       
<tr>
<tr>
    <td><a href="example3.html" title="exemple_title_td"></a><td>
    <td></td>
    <td></td>       
<tr>
<tr>
    <th><a href="example4.html" title="exemple_title_th"></a><th>
    <td></td>
    <td></td>       
<tr>

我只想要没有标签的 tr 。 我试过这个xpath:

//a[@title="exemple_title_th"]/following::tr 

但它会在第一个之后返回所有 tr ,包括以下包含我不想要的标记的tr。这段代码有什么问题?

1 个答案:

答案 0 :(得分:2)

您的xpath //a[@title="exemple_title_th"]/following::tr使用跟随轴,该轴应该选择文档顺序中的所有以下tr元素。

要在整个文档中选择没有tr子元素的th元素,您可以使用简单的xpath,如:

//tr[not(th)]