Question

我想从网站中提取特定链接。

链接看起来像这样：

/topic/Funny/G1pdeJm

链接总是相同的 - 除了最后一个随机字符。

我很难将这些部分结合起来

(preg_match("/^http:\/\//i",$str) || is_file($str))

和

(preg_match("/Funny(.*)/", $str) || is_file($str))

第一个代码提取每个链接链接的第二个摘录只有/ topic / Funny / * part。

不幸的是，我无法将它们组合在一起，我也想阻止这些标签：

/topic/Funny/viral
/topic/Funny/time
/topic/Funny/top
/topic/Funny/top/week
/topic/Funny/top/month
/topic/Funny/top/year
/topic/Funny/top/all

有什么想法吗？

谢谢，Chim

Answer 1

您可以尝试使用否定前瞻来“过滤掉”您不喜欢的网址：

.*\/Funny\/(?!viral|time|top\/week|top\/month|top\/year|top\/all|top(\n|$)).*