Xpath在表格中抓取多个片段,由

时间:2018-04-23 07:16:51

标签: xml xpath

我已经在这工作了一段时间,我甚至不确定我是否朝着正确的方向前进。简单的HTML示例如下;我想要做的只是返回有橙县'在下面。我目前正在使用//table/tr/td[4]/text()[contains(.,'Orange')],但它只能返回td中的第一个地址。有没有办法获取Orange的所有实例,(本例中为2)?

example here...
<table>
<tr>
    <td>
        1. 
    </td>
    <td>
        John Doe 
    </td>
    <td>
        01/02/2001
    </td>
    <td>
        1111 Eastview St, Los Angeles, CA 12345
        <br>
        2222 Brookhurst St, Orange County, CA 12345
        <br>
        3333 Cherry St, Los Angeles, CA 12345
        <br>
        4444 Brookhurst St, Orange County, CA 12345
        <br>
        5555 Cherry St, Los Angeles, CA 12345
    </td>
    <td>
        (213) 555-1212
        <br>
        (213) 555-1212
        <br>
        (213) 555-1212
    </td>
</tr>
</table>

非常感谢任何帮助。

2 个答案:

答案 0 :(得分:0)

正如Andersson指出的那样,我的xpath是正确的(//table/tr/td[4]/text()[contains(.,'Orange')]),它正在返回我想要抓取的项目数组。

答案 1 :(得分:0)

尝试使用它 //table/tr/td[4]/*[contains(text(),'Orange')]