Question

我正在尝试捕获包含条件结尾的URL的中间部分：

网址可以是两种类型：

/a/b/(part/needed)
/a/b/(part/needed)/page/#

这是我使用的正则表达式：

preg_match('@/a/b/(.*)(/page/\d)?@i', '/a/b/some/text/page/1', $matches);

返回

0=>"/a/b/some/text/page/1",
1=>"some/text/page/1"

没关系，但它包含了我不想要的条件结尾！

有人可以告诉我如何不包含以其结尾的条件字符串但是当最后一段存在或不存在时仍然匹配？

Answer 1

通过使用^$锚定表达式并使第一个组非贪婪(.*?)，您可以获得所需的细分。仅.*就是一场贪婪的比赛，并会占用.*之后的所有内容。

preg_match('@^/a/b/(.*?)(/page/\d)?$@i', '/a/b/some/text/page/1', $matches);
//-----------^-------^^^-----------^
print_r($matches);
Array
(
    [0] => /a/b/some/text/page/1
    [1] => some/text
    [2] => /page/1
)

如果您不需要/page/1，请将其设为非捕获组(?:...)。

preg_match('@^/a/b/(.*?)(?:/page/\d)?$@i', '/a/b/some/text/more/page/1', $matches);
//----------------------^^^
print_r($matches);
Array
(
    [0] => /a/b/some/text/more/page/4
    [1] => some/text/more
)

regular-expressions.info提供了有关+和*字符重复的良好信息，以及贪婪的陷阱。

捕获字符串，无条件结束

1 个答案: