一般网址格式

时间:2018-05-23 12:11:50

标签: java regex url netbeans-8

我试图解决从大文本中提取网址的问题,我一直在寻找网址的常规格式,直到找到https://en.wikipedia.org/wiki/URL;我制作了这段代码,但我不知道为什么它没有找到这个网址:

e

任何建议和感谢提前。

1 个答案:

答案 0 :(得分:1)

对我来说,这个正则表达式工作:

(http|https|ftp|mailto|file|data|irc|rtsp)(\:)(\/\/)([a-zA-Z0-9\/%+.-\/]*)\.(com|net|org|jo)\/(\w*\/)*(\w+)

如果您希望此处的URL的最后一部分是第7组,则必须捕获最后一个组

我希望它有所帮助