我想知道如何在php下载网页进行解析?
答案 0 :(得分:14)
你可以使用这样的东西
$homepage = file_get_contents('http://www.example.com/'); echo $homepage;
答案 1 :(得分:10)
由于您可能希望使用DOM解析网页,因此您可以直接加载页面:
$dom = new DOMDocument;
$dom->load('http://www.example.com');
当您的PHP启用allow_url_fopen时。
但基本上,任何支持HTTP stream wrappers的函数都可用于下载页面。
答案 2 :(得分:8)
使用curl库。
答案 3 :(得分:6)
只是添加另一个选项,因为它在那里,而不是最好只是使用文件。它的另一个选项,我没有看到任何人在这里列出。
$array = file("http://www.stackoverflow.com");
如果你想要它在一个行数组中它很好,而已经提到的file_get_contents将把它放在一个字符串中。
你可以做的另一件事。
然后你可以循环通过每一行,如果这符合你的目标:
foreach($array as $line){
echo $line;
// do other stuff here
}
当某些API在每行上吐出纯文本或带有新条目的html时,这会派上用场。
答案 4 :(得分:3)
您可以使用此代码
$url = 'your url';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec ($ch);
curl_close ($ch);
// you can do something with $data like explode(); or a preg match regex to get the exact information you need
//$data = strip_tags($data);
echo $data;