在正则表达式的捕获组中排除斜杠

时间:2016-02-16 07:16:38

标签: regex

我有字符串,其值类似于

"urls":[
        {
         "url":"https:\/\/t.co\/OjiDUThEvK",
         "expanded_url":"http:(escape sequence slash)/(escape sequence slash)/fb.me\/7Wnh0hMLL",
         "display_url":"fb.me(escape sequence slash)/7Wnh0hMLL",
         "indices":[48,71]}],
         "user_mentions":[],
         "symbols":[]
        }
      ] 

我只需捕获“扩展的网址”我尝试了以下正则表达式:

"expanded_url"\:\"http\:\\\/\\\/(.*?)\"

这给出了一个结果:

"fb.me(escape sequence slash)/7Wnh0hMLL" 

但我想在URL中排除转义序列斜杠,是否有可能实现相同,请让我知道我对正则表达式所做的更改

1 个答案:

答案 0 :(得分:0)

如果这就是你所追求的,我不能100%肯定。你可以发布没有“(转义序列斜杠)”部分的原始输入,我假设这实际上是在你匹配的文本中。

匹配

\"expanded_url\":\"http:\\\/\\\/([^\\]*)\\\/([^\\"]*)\"

替换为:

$1/$2