从远程站点获取表的内容

时间:2012-10-27 23:08:48

标签: php

  

可能重复:
  How to parse and process HTML with PHP?

我想使用file_get_contents()获取远程网站的内容。本网站包含我感兴趣的文本,图像和表格。该远程站点上有下一个表:

<table style="width: 100%" class="style36">
    <tr>
        <td style="width: 25%" class="style38">B3</td>
        <td style="width: 60%" class="style38">Las Flores</td>
        <td style="width: 15%" class="style38">0</td>
    </tr>
</table>

每个单元格的值都是动态的,我想以最快,最可靠的方式查询它们。

我尝试将file_get_contents函数限制为只读取X个字符,但由于页面是动态的,我真的不知道我的表格从哪个字符开始。

提前致谢

2 个答案:

答案 0 :(得分:0)

我建议改用curl

获得页面输出后,您可以使用各种工具来解析内容。谷歌将成为你的朋友,特别是如果你想找到一个PHP HTML解析器。

PHP有大量的DOM功能可供您使用,因此您也可以使用自己的功能。

答案 1 :(得分:0)

你想看一下概念调用抓取;有web抓取库可用,或者你可以使用preg_match_all()来获取正则表达式所需的元素。 Scraping Library for PHP - phpQuery?查看该链接。