Question

我试图解决从大文本中提取网址的问题，我一直在寻找网址的常规格式，直到找到https://en.wikipedia.org/wiki/URL;我制作了这段代码，但我不知道为什么它没有找到这个网址：

任何建议和感谢提前。

Answer 1

对我来说，这个正则表达式工作：

(http|https|ftp|mailto|file|data|irc|rtsp)(\:)(\/\/)([a-zA-Z0-9\/%+.-\/]*)\.(com|net|org|jo)\/(\w*\/)*(\w+)

如果您希望此处的URL的最后一部分是第7组，则必须捕获最后一个组

我希望它有所帮助