如何删除infront正则表达式?

时间:2014-04-22 05:45:28

标签: regex matlab

如何删除'http'或'https和'www',然后在给定'http://www.google.com'时留下'google.com'?

no_http_URL = regexp(domain_URL,'[a-z]+://','match','once')

上面的代码为结果返回'http',这与我的答案相反。

2 个答案:

答案 0 :(得分:1)

no_http_URL = regexp('http://google.com',     'https?://(?:www\.)?(.*)','tokens','once')
no_http_URL = regexp('http://www.google.com', 'https?://(?:www\.)?(.*)','tokens','once')
no_http_URL = regexp('https://google.com',    'https?://(?:www\.)?(.*)','tokens','once')
no_http_URL = regexp('https://www.google.com','https?://(?:www\.)?(.*)','tokens','once')

在上面的表达式中,no_http_URL1x1 cell array。如果需要访问字符串值,则需要执行以下

no_http_URL = no_http_URL{1,1}

答案 1 :(得分:0)

如果它以http://?

开头,你不能只删除网址的前7个字符

编辑:你不能找到网址中的第一个点并删除之前的所有内容吗?我的意思是,将点后面的字符放入子字符串。