我想知道是否有任何好的PHP脚本(库)来检查链接是否被破坏?我有链接到mysql表中的文档,可能只是检查链接是否通向文档,或者我是否被重定向到anther url。任何的想法?我更喜欢用PHP来做。
可能与: Check link works and if not visually identify it as broken
答案 0 :(得分:25)
您可以使用此功能检查断开的链接:
function check_url($url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch , CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec($ch);
$headers = curl_getinfo($ch);
curl_close($ch);
return $headers['http_code'];
}
您需要安装CURL
才能使用此功能。现在,您可以使用以下方法检查损坏的链接:
$check_url_status = check_url($url);
if ($check_url_status == '200')
echo "Link Works";
else
echo "Broken Link";
另请查看此状态代码的链接:HTTP Status Codes
我认为您还可以检查301
和302
状态代码。
另一种方法是使用get_headers
函数。但这只适用于PHP版本大于5的情况:
function check_url($url) {
$headers = @get_headers( $url);
$headers = (is_array($headers)) ? implode( "\n ", $headers) : $headers;
return (bool)preg_match('#^HTTP/.*\s+[(200|301|302)]+\s#i', $headers);
}
在这种情况下,只需检查输出:
if (check_url($url))
echo "Link Works";
else
echo "Broken Link";
希望这可以帮助你:)。
答案 1 :(得分:4)
您可以通过以下几种方式实现这一目标:
第一种方式 - 卷曲
function url_exists($url) {
$ch = @curl_init($url);
@curl_setopt($ch, CURLOPT_HEADER, TRUE);
@curl_setopt($ch, CURLOPT_NOBODY, TRUE);
@curl_setopt($ch, CURLOPT_FOLLOWLOCATION, FALSE);
@curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
$status = array();
preg_match('/HTTP\/.* ([0-9]+) .*/', @curl_exec($ch) , $status);
return ($status[1] == 200);
}
第二种方式 - 如果你没有安装curl - 获取标题
function url_exists($url) {
$h = get_headers($url);
$status = array();
preg_match('/HTTP\/.* ([0-9]+) .*/', $h[0] , $status);
return ($status[1] == 200);
}
第三种方式 - fopen
function url_exists($url){
$open = @fopen($url,'r');
if($handle !== false){
return true;
}else{
return false;
}
}
答案 2 :(得分:2)
作为快速解决方法检查,您可以将全局变量$http_response_header与file_get_contents()函数一起使用。
例如(从PHP文档中提取):
<?php
function get_contents() {
file_get_contents("http://example.com");
var_dump($http_response_header);
}
get_contents();
var_dump($http_response_header);
然后检查第一行中的状态代码是否为“HTTP / 1.1 200 OK”或其他HTTP status codes。
答案 3 :(得分:1)
试试这个:
$url = '[your_url]';
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
$result = curl_exec($curl);
if ($result === false) {
echo 'broken url';
} else {
$newUrl = curl_getinfo($curl, CURLINFO_EFFECTIVE_URL);
if ($newUrl !== $url) {
echo 'redirect to: ' . $newUrl;
}
}
curl_close($curl);