在Curl之后将相对URL更改为绝对URL

时间:2016-07-23 16:40:30

标签: php regex curl

我正在尝试找到一个能够将curl'ed文档的所有网址从相对位置更改为绝对位置的正则表达式。

我找到的方法之一是帖子here,但它仅适用于第一个网址,而不适用于所有网址。

这是我正在使用的代码:

$url="http://www.example.com";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_FAILONERROR, 1);                                                   
curl_setopt($ch, CURLOPT_DNS_USE_GLOBAL_CACHE, 0);                              
curl_setopt($ch, CURLOPT_DNS_CACHE_TIMEOUT, 60);                                
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);                                         
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);                                            
$result=curl_exec($ch);
curl_close($ch);
$result = preg_replace('~(href|src)=(["\'])(?!#)(?!http://)([^\2]*)\2~i','$1="http://www.example.com$3"', $result);
echo $result; 

我在哪里做错了?

EDIT 只是为了更好地解释。我没有一个url数组,但我有一个从curl收集的整个文档,所以我需要一个preg替换方法。

1 个答案:

答案 0 :(得分:1)

我不确定为什么它只替换它一次(也许它与反向引用有关),但是当你将它包装在while循环中时,它应该可以工作。

$pattern = '~(href|src)=(["\'])(?!#|//|http)([^\2]*)\2~i';
while (preg_match($pattern, $result)) {
    $result = preg_replace($pattern,'$1="http://www.example.com$3"', $result);
}

(我也稍微改变了模式。)