我想使用file_get_contents()获取远程网站的内容。本网站包含我感兴趣的文本,图像和表格。该远程站点上有下一个表:
<table style="width: 100%" class="style36">
<tr>
<td style="width: 25%" class="style38">B3</td>
<td style="width: 60%" class="style38">Las Flores</td>
<td style="width: 15%" class="style38">0</td>
</tr>
</table>
每个单元格的值都是动态的,我想以最快,最可靠的方式查询它们。
我尝试将file_get_contents函数限制为只读取X个字符,但由于页面是动态的,我真的不知道我的表格从哪个字符开始。
提前致谢
答案 0 :(得分:0)
我建议改用curl
。
获得页面输出后,您可以使用各种工具来解析内容。谷歌将成为你的朋友,特别是如果你想找到一个PHP HTML解析器。
PHP有大量的DOM功能可供您使用,因此您也可以使用自己的功能。
答案 1 :(得分:0)
你想看一下概念调用抓取;有web抓取库可用,或者你可以使用preg_match_all()来获取正则表达式所需的元素。 Scraping Library for PHP - phpQuery?查看该链接。