解析页面源以检索表数据,然后导出到xls

时间:2011-08-08 23:48:55

标签: php excel parsing dom

我需要将页面源转储到表单中,并让它吐出一个包含页面表内容的xls文件。

我要解析的页面上有几个表,有不同的行和11列。每个表都有一个标题,我不需要。我已经研究过使用DOM,但我无法找到一种方法来将该对象用于我的应用程序。我也想过使用preg_replace(),但是再次,因为我正在处理源代码,我认为那不行。

一旦我的解析部分正确,我知道如何将它写入php中的xls文件。我只是无法弄清楚如何在PHP中解决这个问题。提前谢谢。

如果有帮助,这就是每个表的表结构。

<table>
  <thead>
      <tr>
        <td>
        </td>
      </tr>
  </thead>
  <tbody>
      <tr>
        <td>
       </td>
     </tr>
 </tbody>
</table>

1 个答案:

答案 0 :(得分:0)

这应该让你至少开始

$doc = new DOMDocument();
$doc->loadHTML($htmlString);

// Get all tables bodies
$tables = $doc->getElementsByTagName('tbody');

foreach ($tables as $table) {
    $rows = $table->getElementsByTagName('tr');
    foreach ($rows as $row) {
        $cells = $row->getElementsByTagName('td');
        foreach ($cells as $cell) {
            $textContent = $cell->nodeValue;
        }
    }
}