我试图解决从大文本中提取网址的问题,我一直在寻找网址的常规格式,直到找到https://en.wikipedia.org/wiki/URL;我制作了这段代码,但我不知道为什么它没有找到这个网址:
e
任何建议和感谢提前。
答案 0 :(得分:1)
对我来说,这个正则表达式工作:
(http|https|ftp|mailto|file|data|irc|rtsp)(\:)(\/\/)([a-zA-Z0-9\/%+.-\/]*)\.(com|net|org|jo)\/(\w*\/)*(\w+)
如果您希望此处的URL的最后一部分是第7组,则必须捕获最后一个组
我希望它有所帮助