Question

我如何制作一个正则表达式只能得到“TITLE”这个词并过滤掉其余部分。

标题可以改变

示例：

http://blogx.blogspot.com/2012/04/TITLE.html?showComment=13348745236XXXXXXX

我得到了什么：

http://[a-z{1,20}].blogspot.com/{4}/{2}/______\.(.*)$

Answer 1

试试这个

blogspot\.com\/.*?([^\/]+)\.html

([^\/]+)是一个否定的字符类，它与斜杠匹配，直到有“.html”。

您将在捕获组1中找到“标题”。

除了缺少的标题部分

之外，您的尝试还有其他问题

http://[a-z{1,20}].blogspot.com/{4}/{2}/______\.(.*)$
           ^^^^^^^              ^^^ ^^^

使用正则表达式，解决方案可能看起来像

http://[a-z]{1,20}.blogspot.com/\d{4}/\d{2}/([^\/]+)\.(.*)$

Answer 2

(?<=http://blogx\.blogspot\.com\/\d{4}/\d{2}/).*?(?=\.)