使用或不使用协议验证URL

时间:2012-12-18 05:53:14

标签: php regex

您好我想验证以下网址,所以只要有.com,.net,.org等TLD,他们都会在其中包含或不包含http / www部分。

有效网址应为:

http://www.domain.com
http://domain.com
https://www.domain.com
https://domain.com
www.domain.com
domain.com

支持长标记:

http://www.domain.com.uk
http://domain.com.uk
https://www.domain.com.uk
https://domain.com.uk
www.domain.com.uk
domain.com.uk

支持短划线( - ):

http://www.domain-here.com
http://domain-here.com
https://www.domain-here.com
https://domain-here.com
www.domain-here.com
domain-here.com

还支持域中的数字:

http://www.domain1-test-here.com
http://domain1-test-here.com
https://www.domain1-test-here.com
https://domain1-test-here.com
www.domain1-test-here.com
domain-here.com

也许甚至可以允许IP:

127.127.127.127

(但这是额外的!)

也允许破折号( - ),忘记提及=)

我发现许多功能可以验证一个或另一个,但不能同时验证两个。 如果有人知道正确的正则表达式,请分享。谢谢你的帮助。

4 个答案:

答案 0 :(得分:4)

用于网址验证的完美解决方案。

以上答案是正确的,但不适用于所有域名,例如.me,.it,.in

所以请在下方用户进行网址匹配:

$pattern = '/(?:https?:\/\/)?(?:[a-zA-Z0-9.-]+?\.(?:[a-zA-Z])|\d+\.\d+\.\d+\.\d+)/';

if(preg_match($pattern, "http://website.in"))
{
echo "valid";
}else{
echo "invalid";
}

答案 1 :(得分:1)

当您忽略路径部分并仅查找域部分时,一个简单的规则就是

(?:https?://)?(?:[a-zA-Z0-9.-]+?\.(?:com|net|org|gov|edu|mil)|\d+\.\d+\.\d+\.\d+)

如果您还想支持国家/地区顶级域名,则必须提供完整(当前)列表或将|..附加到顶级域名部分。

使用preg_match,您必须将其包装在某些分隔符

之间
$pattern = ';(?:https?://)?(?:[a-zA-Z0-9.-]+?\.(?:com|net|org|gov|edu|mil)|\d+\.\d+\.\d+\.\d+);';
$index = preg_match($pattern, $url);

通常,您使用/。但在这种情况下,斜杠是模式的一部分,所以我选择了一些其他分隔符。否则我必须使用\

来逃避斜杠
$pattern = '/(?:https?:\/\/)?(?:[a-zA-Z0-9.-]+?\.(?:com|net|org|gov|edu|mil)|\d+\.\d+\.\d+\.\d+)/';

答案 2 :(得分:0)

不要使用正则表达式。并非每个涉及字符串的问题都需要使用正则表达式。

不要编写自己的URL验证程序。 URL验证是一个已解决的问题,现有的代码已经编写,调试和测试。事实上,它标配PHP。

查看PHP的内置过滤功能:http://us2.php.net/manual/en/book.filter.php

答案 3 :(得分:0)

我认为您可以flags使用filter_vars

对于FILTER_VALIDATE_URL,有几个标志可用:

  • FILTER_FLAG_SCHEME_REQUIRED要求网址包含方案 一部分。
  • FILTER_FLAG_HOST_REQUIRED要求网址包含主机 一部分。
  • FILTER_FLAG_PATH_REQUIRED要求网址包含路径 一部分。
  • FILTER_FLAG_QUERY_REQUIRED要求网址包含查询 字符串。
默认情况下使用

FILTER_FLAG_SCHEME_REQUIREDFILTER_FLAG_HOST_REQUIRED

让我们说你想检查路径部分而不想检查方案部分,你可以做这样的事情(falg是一个位掩码):

filter_var($url, FILTER_VALIDATE_URL, ~FILTER_FLAG_SCHEME_REQUIRED | FILTER_FLAG_PATH_REQUIRED)