URL正则表达式的开头和结尾

时间:2012-04-20 05:27:57

标签: regex url

我如何制作一个正则表达式只能得到“TITLE”这个词并过滤掉其余部分。

标题可以改变

示例:

  

http://blogx.blogspot.com/2012/04/TITLE.html?showComment=13348745236XXXXXXX

我得到了什么:

http://[a-z{1,20}].blogspot.com/{4}/{2}/______\.(.*)$

2 个答案:

答案 0 :(得分:1)

试试这个

blogspot\.com\/.*?([^\/]+)\.html

here on Regexr

([^\/]+)是一个否定的字符类,它与斜杠匹配,直到有“.html”。

您将在捕获组1中找到“标题”。

除了缺少的标题部分

之外,您的尝试还有其他问题
http://[a-z{1,20}].blogspot.com/{4}/{2}/______\.(.*)$
           ^^^^^^^              ^^^ ^^^
  1. 量词必须在字符类之外。

  2. 您这里只提供了量词。这将连续匹配7 /(顺便说一句,具体取决于你的正则表达式风格和/或你需要转义斜杠的正则表达式分隔符)。

  3. 使用正则表达式,解决方案可能看起来像

    http://[a-z]{1,20}.blogspot.com/\d{4}/\d{2}/([^\/]+)\.(.*)$
    

    Regexr

    上查看

答案 1 :(得分:0)

(?<=http://blogx\.blogspot\.com\/\d{4}/\d{2}/).*?(?=\.)