我需要PHP中的regexp才能在URL中找到http-equiv =“refresh”元标记。我需要的是要遵循的实际URL。现在,据我所知,有两种有效的方法可以使用这个元标记:
content="0; url=urlhere" http-equiv="refresh" />
和
http-equiv="refresh" content="0; url=urlhere"/>
谢谢!
答案 0 :(得分:5)
迪马,
试试这个:
<?
preg_match('|content="\d+;url=(.*?)"|i', '<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://www.stackoverflow.com">', $res1);
preg_match('|content="\d+;url=(.*?)"|i', '<META CONTENT="5;URL=http://www.stackoverflow.com" HTTP-EQUIV="Refresh">', $res2);
echo "<pre>";
var_dump($res1);
var_dump($res2);
echo "</pre>";
?>
输出:
array(2) {
[0]=>
string(44) "CONTENT="5;URL=http://www.stackoverflow.com""
[1]=>
string(28) "http://www.stackoverflow.com"
}
array(2) {
[0]=>
string(44) "CONTENT="5;URL=http://www.stackoverflow.com""
[1]=>
string(28) "http://www.stackoverflow.com"
}
请记住,您必须处理空格(内部内容属性,标记之间,http-equiv属性内部等),例如:
<META HTTP-EQUIV="Refresh" CONTENT=" 5 ; URL=http://www.stackoverflow.com ">
以下代码段处理该情况:
<?
preg_match('|content="\s*\d+\s*;\s*url=(.*?)\s*"|i', '<META HTTP-EQUIV="Refresh" CONTENT=" 5 ; URL=http://www.stackoverflow.com ">', $res3);
echo "<pre>";
var_dump($res3);
echo "</pre>";
?>
输出:
array(2) {
[0]=>
string(48) "CONTENT=" 5 ; URL=http://www.stackoverflow.com ""
[1]=>
string(28) "http://www.stackoverflow.com"
}
最后,如果这还不够,你可以在内容属性的每一侧检查http-equiv =“refresh”(总是考虑到空白区域),如下所示:
<?
preg_match('|(?:http-equiv="refresh".*?)?content="\d+;url=(.*?)"(?:.*?http-equiv="refresh")?|i', '<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://www.stackoverflow.com">', $res4);
preg_match('|(?:http-equiv="refresh".*?)?content="\d+;url=(.*?)"(?:.*?http-equiv="refresh")?|i', '<META CONTENT="5;URL=http://www.stackoverflow.com" HTTP-EQUIV="Refresh">', $res5);
echo "<pre>";
var_dump($res4);
var_dump($res5);
echo "</pre>";
?>
输出:
array(2) {
[0]=>
string(44) "CONTENT="5;URL=http://www.stackoverflow.com""
[1]=>
string(32) "http://www.stackoverflow.com"
}
array(2) {
[0]=>
string(65) "CONTENT="5;URL=http://www.stackoverflow.com" HTTP-EQUIV="Refresh""
[1]=>
string(32) "http://www.stackoverflow.com"
}
你可以使用相同的方法。添加支持考虑部件。
另外,请记住始终使用i选项运行正则表达式,以启用不区分大小写的匹配。
答案 1 :(得分:3)
http-equiv\W*refresh.+?url\W+?["'](.+?)["']
尝试:
if (preg_match('/meta.+?http-equiv\W+?refresh/i', $x)) {
preg_match('/content.+?url\W+?["\'](.+?)["\']/i', $x, $matches);
print_r($matches);
}