RegEx从URL中间删除文本

时间:2013-02-28 16:03:19

标签: regex

我有一个客户正在将她的网站从Blogger转移到Wordpress博客。我在Blogger中放了一些代码,将访问者重定向到正确的Wordpress帖子/页面。因此,当Blogger重定向帖子时,它会以 www.domain.com/?bloggerURL=/yyyy/mm/the-post-slug.html

的形式出现。

有了这个正则表达式,我成功地返回了正确的Wordpress网址: www.domain.com/yyyy/mm/the-post-slug (带有“?bloggerURL = /”和“。 html“已删除”

^\?bloggerURL=/(.*)\.html$

Blogger页面被重定向为 www.domain.com/?bloggerURL=/p/the-page-slug.html 我尝试将/ p添加到正则表达式以解决此问题,但它不起作用。

^\?bloggerURL=/p/(.*)\.html$

例如, www.domain.com/?bloggerURL=/p/about.html 应重定向到 www.domain.com/about ,但网址是仍然是 www.domain.com/?bloggerURL=/p/about.html

我可能遗漏了一些简单的东西,让它拿起字符串的第一部分并将其删除。是否需要添加/删除以使该案例有效?

1 个答案:

答案 0 :(得分:0)

只是通过陈旧的,未解决的问题...希望你已经解决了这个问题,但是如果没有,我在正则表达式中看到的唯一问题是非转义斜线。我想你需要使用:

^\?bloggerURL=\/p\/(.*)\.html$

希望这可能有助于其他人。