如何在PHP中验证这些维基百科URL?

时间:2016-06-29 07:27:31

标签: php regex

网址:https://en.m.wikipedia.org/wiki/Professional_Tax

未使用Regex进行验证:

function isValidURL($url) {
 return preg_match('|^(http(s)?://)?[a-z0-9-]+\.(.[a-z0-9-]+)+(:[0-9]+)?(/.*)?$|i', $url);
}

所以这样做的目的是:我们在帖子(论坛)中嵌入了很多网址 - 我们想创建一个基本上可以跟踪哪些网址仍然很好的脚本。为此,我们需要从帖子中提取URL并创建一个数据库 - 可以定期检查其状态代码。

2 个答案:

答案 0 :(得分:1)

要匹配此网址您可以使用以下网址:

^https?\:\/\/([\w\.]+)wikipedia.org\/wiki\/([\w]+\_?)+

这只匹配网址,但要验证哪些网址仍然不错(如果我理解正确则表示有效)...这不是正则表达式的工作。

答案 1 :(得分:0)

以下是大多数网址的替代正则表达式:

(?<![@\w])(((http|https)(:\/\/))?([\w\-_]{2,})(([\.])([\w\-_]*)){1,})([\w.,@?^=%&amp;:\/~+#-]*[\w@?^=%&amp;\/~+#-])

您可以在此处试用正则表达式:https://regex101.com/