我在我的应用程序中进行了基本的URL验证。现在我正在使用以下代码。
//validates whether the given value is
//a valid URL
function validateUrl(value)
{
var regexp = /(ftp|http|https):\/\/(\w+:{0,1}\w*@)?(\S+)(:[0-9]+)?(\/|\/([\w#!:.?+=&%@!\-\/]))?/
return regexp.test(value);
}
但是现在它没有接受没有协议的URL。对于前者如果我提供www.google.com它不接受它。如何修改RegEx以使其接受没有协议的URL?
答案 0 :(得分:5)
这是匹配网址的一个很长的正则表达式:
(?i)\b((?:(?:[a-z][\w-]+:)?(?:/{1,3}|[a-z0-9%])|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:'".,<>?«»“”‘’]))
该版本的扩展版本(以帮助使其易于理解):
(?xi)
\b
( # Capture 1: entire matched URL
(?:
(?:[a-z][\w-]+:)? # URL protocol and colon
(?:
/{1,3} # 1-3 slashes
| # or
[a-z0-9%] # Single letter or digit or '%'
# (Trying not to match e.g. "URI::Escape")
)
| # or
www\d{0,3}[.] # "www.", "www1.", "www2." … "www999."
| # or
[a-z0-9.\-]+[.][a-z]{2,4}/ # looks like domain name followed by a slash
)
(?: # One or more:
[^\s()<>]+ # Run of non-space, non-()<>
| # or
\(([^\s()<>]+|(\([^\s()<>]+\)))*\) # balanced parens, up to 2 levels
)+
(?: # End with:
\(([^\s()<>]+|(\([^\s()<>]+\)))*\) # balanced parens, up to 2 levels
| # or
[^\s`!()\[\]{};:'".,<>?«»“”‘’] # not a space or one of these punct chars
)
)
这些都来自this page,但稍微修改以使协议正确可选 - 您应该阅读该页面以帮助理解它正在做什么,并且它还有一个仅与基于Web的URL匹配的变体,您可以使用它可能也想看一看。
答案 1 :(得分:1)
使用(...)?
/(((ftp|http|https):\/\/)|(\/\/))?(\w+:{0,1}\w*@)?(\S+)(:[0-9]+)?(\/|\/([\w#!:.?+=&%@!\-\/]))?/
答案 2 :(得分:1)
将正则表达式更改为:
/((ftp|http|https):\/\/)?(\w+:{0,1}\w*@)?(\S+)(:[0-9]+)?(\/|\/([\w#!:.?+=&%@!\-\/]))?/
答案 3 :(得分:1)
我不是正则表达式专家,但是使用另一个括号围绕协议并在末尾使用问号应该使其成为可选:
function validateUrl(value)
{
var regexp = /((ftp|http|https):\/\/)?(\w+:{0,1}\w*@)?(\S+)(:[0-9]+)?(\/|\/([\w#!:.?+=&%@!\-\/]))?/
return regexp.test(value);
}
答案 4 :(得分:0)
将第一部分更改为:
(?:(ftp|http|https):)?(?:\/\/)?
(?:
... )
会在不使用捕获组的情况下对内容进行分组(因此实际协议仍保留在第一组中)。
请注意protocol:
和//
部分是如何单独选择的 - 因为//www.google.com
是有效(相对)网址。