如何获得网页源的一部分?

时间:2010-06-12 09:23:44

标签: php

我试图找到获取Web源页面的一部分的方法?我正在使用php获取页面的所有源代码,但我不需要获取整个页面源。

有人可以帮助我吗?

3 个答案:

答案 0 :(得分:2)

您可以使用 Simple HTML DOM 轻松完成此操作。

示例:

// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');

// Find all images
foreach($html->find('img') as $element)
       echo $element->src . '<br>';

// Find all links
foreach($html->find('a') as $element)
       echo $element->href . '<br>'; 

more to it ,请访问提供的链接以获取更多相关信息。

注意:如果您的意思是服务器端源代码(PHP,ASP.Net等),则无法在此处进行。

答案 1 :(得分:2)

HTTP有几个request headers that deal with ranges,但即使服务器支持它们,它们也不是一个非常实用的方法来获取更大的HTML文档。

您最好让服务器提供一个API,它可以为您提供所需的信息(这可能涉及与运行该网站的任何人进行协商,如果不是您的话)。

答案 2 :(得分:0)

好的,使用域套接字连接(fsockopen)并使用fseek跳过您不想要的部分。