应用错误收集

我正在尝试创建一个将提取URL的表达式

时间：2010-07-17 13:48:50

标签： regex url extract

我想从网页中提取URL，这些URL本身就是URL而不是超链接等，它们只是文本。一些例子可能是http://www.example.com，http://example.com，www.example.com等等。我在正则表达式中非常新，所以我复制并粘贴了20个在线表达式都无法正常工作。我不知道我做得对不对。任何帮助都会非常感激。

2 个答案:

答案 0 :(得分：0)

你可能没有逃脱.。您需要为每个人使用\.。

看看strfriend.com。它有一个URL示例，并以图形方式表示。

它建议的例子是：

^((ht|f)tp(s?)://|~/|/)?(\w+:\w+@)?([a-zA-Z]{1}([\w-]+.)+(\w{2,5}))(:\d{1,5})?((/?\w+/)+|/?)(\w+.\w{3,4})?((\?\w+=\w+)?(&\w+=\w+)*)?

答案 1 :(得分：0)

我写了一篇关于使用Regex查找HTML页面内链接的帖子（目的是使用JavaScript在弹出窗口中打开外部链接或链接到PDF等文档）。

最终的正则表达式是： ^（：[./] +？）（：资产| HTTPS：？？？！？？//（（：万维网）integralist））？

完整的帖子在这里： http://www.integralist.co.uk/javascript/regular-expression-to-open-external-links-in-popup-window/

解决方案不会很完美，但可能会帮助您指明正确的方向。

标记