使用HtmlUnit中的XPath获取嵌套div中的跨度

时间:2018-09-19 14:35:44

标签: html xpath htmlunit

我是XPath的初学者,无法从网站获取所需的值。我将其与HtmlUnit一起使用。 这是我面临的格式:

<html>
  <head>
  <body>
    <div>
    <script>
    ..more scripts..
    <div>
       <header>
       <script>
       <script>
       <div>
         <div>
           <div>
           <div>
             <table>
               <thead>
               <tbody>
                 <tr>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                 <tr>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   ..

我想从中提取值,但是到目前为止,每次尝试都失败了。 我试图仅通过使用以下xpath找到跨度:

//span

但是然后我只返回一个跨度,该跨度位于我不感兴趣的标题下。我也尝试过:

//body//div[2]//div[1]//div[1]//div[2]//table//tbody//tr//td//a//span

没有返回任何内容。 我也尝试过其他没有成功的道路。任何人都可以帮助我获取表下所有跨度的正确路径是什么?预先感谢。

0 个答案:

没有答案