正则表达式preg_match没有按预期工作

时间:2016-09-14 06:44:36

标签: php regex preg-match

所以我从数据库中获取链接,看起来像这样:

www.website.com/games/randomcode1/RANDOM-URL-TITLE-NEEDED.html
www.website.com/blabla/randomcode2/RANDOM-URL-TITLE-NEEDED2.htm
www.website.com/whatever/randomcode2/RANDOM-URL-TITLE-NEEDED3.html

在我的foreach循环中,Urls表示为$row['links']; 我想要做的只是采取RANDOM-URL-TITLE-NEED。这意味着我需要从最后一个斜杠(在随机码之后)到URL末尾的URL中的文本。 我正在使用这个preg匹配函数来获取我需要的东西,但似乎我在开始时没有使用regerx(?)。任何建议:

preg_match('#/(?:.*?).htm#is', $row['links'], $vardas);
$vardas = $vardas[0];

2 个答案:

答案 0 :(得分:2)

您实际上匹配第一个/,然后匹配任何1个字符,直到第一个htm

我相信你需要

#/([^/]*)\.html?$#i

请参阅regex demo

详细

  • / - 文字/
  • ([^/]*) - 第1组捕获除/
  • 以外的0 +字符
  • \. - 文字.
  • html? - htmlhtm
  • $ - 字符串结尾

preg_filter模式的变体(如果你传递一个字符串数组):

$urls = array("www.website.com/games/RANDOM-URL-TITLE-NOT_NEEDED.xhtml",
    "www.website.com/games/randomcode1/RANDOM-URL-TITLE-NEEDED.html",
    "www.website.com/blabla/randomcode2/RANDOM-URL-TITLE-NEEDED2.htm",
    "www.website.com/whatever/randomcode2/RANDOM-URL-TITLE-NEEDED3.html");

print_r(preg_filter('#^.*/(.*)\.html?$#i', '$1', $urls));

请参阅PHP demo,仅返回

[1] => RANDOM-URL-TITLE-NEEDED
[2] => RANDOM-URL-TITLE-NEEDED2
[3] => RANDOM-URL-TITLE-NEEDED3

更新的正则表达式匹配:

  • ^ - 字符串开头
  • .*/ - 除了换行符之外的0 +字符,直到最后/和斜杠本身
  • (.*) - 第1组尽可能多地捕获除换行符之外的任何0 +字符
  • \.html? - .htm.html子串...
  • $ - 字符串的结尾。

$1是对第1组中捕获的值的反向引用。

答案 1 :(得分:2)

不使用正则表达式的更优雅方式:

echo pathinfo($url)['filename'];