我想从网页中提取URL,这些URL本身就是URL而不是超链接等,它们只是文本。一些例子可能是http://www.example.com
,http://example.com
,www.example.com
等等。我在正则表达式中非常新,所以我复制并粘贴了20个在线表达式都无法正常工作。我不知道我做得对不对。任何帮助都会非常感激。
答案 0 :(得分:0)
你可能没有逃脱.
。您需要为每个人使用\.
。
看看strfriend.com。它有一个URL示例,并以图形方式表示。
它建议的例子是:
^((ht|f)tp(s?)://|~/|/)?(\w+:\w+@)?([a-zA-Z]{1}([\w-]+.)+(\w{2,5}))(:\d{1,5})?((/?\w+/)+|/?)(\w+.\w{3,4})?((\?\w+=\w+)?(&\w+=\w+)*)?
答案 1 :(得分:0)
我写了一篇关于使用Regex查找HTML页面内链接的帖子(目的是使用JavaScript在弹出窗口中打开外部链接或链接到PDF等文档)。
最终的正则表达式是: ^(:[./] +?)(:资产| HTTPS:???!??//((:万维网)integralist))?
完整的帖子在这里: http://www.integralist.co.uk/javascript/regular-expression-to-open-external-links-in-popup-window/
解决方案不会很完美,但可能会帮助您指明正确的方向。
标记