我正在尝试创建一个将提取URL的表达式

时间:2010-07-17 13:48:50

标签: regex url extract

我想从网页中提取URL,这些URL本身就是URL而不是超链接等,它们只是文本。一些例子可能是http://www.example.comhttp://example.comwww.example.com等等。我在正则表达式中非常新,所以我复制并粘贴了20个在线表达式都无法正常工作。我不知道我做得对不对。任何帮助都会非常感激。

2 个答案:

答案 0 :(得分:0)

你可能没有逃脱.。您需要为每个人使用\.

看看strfriend.com。它有一个URL示例,并以图形方式表示。

它建议的例子是:

^((ht|f)tp(s?)://|~/|/)?(\w+:\w+@)?([a-zA-Z]{1}([\w-]+.)+(\w{2,5}))(:\d{1,5})?((/?\w+/)+|/?)(\w+.\w{3,4})?((\?\w+=\w+)?(&\w+=\w+)*)?

答案 1 :(得分:0)

我写了一篇关于使用Regex查找HTML页面内链接的帖子(目的是使用JavaScript在弹出窗口中打开外部链接或链接到PDF等文档)。

最终的正则表达式是: ^(:[./] +?)(:资产| HTTPS:???!??//((:万维网)integralist))?

完整的帖子在这里: http://www.integralist.co.uk/javascript/regular-expression-to-open-external-links-in-popup-window/

解决方案不会很完美,但可能会帮助您指明正确的方向。

标记