所以我从数据库中获取链接,看起来像这样:
www.website.com/games/randomcode1/RANDOM-URL-TITLE-NEEDED.html
www.website.com/blabla/randomcode2/RANDOM-URL-TITLE-NEEDED2.htm
www.website.com/whatever/randomcode2/RANDOM-URL-TITLE-NEEDED3.html
在我的foreach循环中,Urls表示为$row['links'];
我想要做的只是采取RANDOM-URL-TITLE-NEED。这意味着我需要从最后一个斜杠(在随机码之后)到URL末尾的URL中的文本。
我正在使用这个preg匹配函数来获取我需要的东西,但似乎我在开始时没有使用regerx(?)。任何建议:
preg_match('#/(?:.*?).htm#is', $row['links'], $vardas);
$vardas = $vardas[0];
答案 0 :(得分:2)
您实际上匹配第一个/
,然后匹配任何1个字符,直到第一个htm
。
我相信你需要
#/([^/]*)\.html?$#i
请参阅regex demo
详细:
/
- 文字/
([^/]*)
- 第1组捕获除/
\.
- 文字.
html?
- html
或htm
$
- 字符串结尾 preg_filter
模式的变体(如果你传递一个字符串数组):
$urls = array("www.website.com/games/RANDOM-URL-TITLE-NOT_NEEDED.xhtml",
"www.website.com/games/randomcode1/RANDOM-URL-TITLE-NEEDED.html",
"www.website.com/blabla/randomcode2/RANDOM-URL-TITLE-NEEDED2.htm",
"www.website.com/whatever/randomcode2/RANDOM-URL-TITLE-NEEDED3.html");
print_r(preg_filter('#^.*/(.*)\.html?$#i', '$1', $urls));
请参阅PHP demo,仅返回
[1] => RANDOM-URL-TITLE-NEEDED
[2] => RANDOM-URL-TITLE-NEEDED2
[3] => RANDOM-URL-TITLE-NEEDED3
更新的正则表达式匹配:
^
- 字符串开头.*/
- 除了换行符之外的0 +字符,直到最后/
和斜杠本身(.*)
- 第1组尽可能多地捕获除换行符之外的任何0 +字符\.html?
- .htm
或.html
子串... $
- 字符串的结尾。 $1
是对第1组中捕获的值的反向引用。
答案 1 :(得分:2)
不使用正则表达式的更优雅方式:
echo pathinfo($url)['filename'];