从php中的网站提取特定链接

时间:2016-12-03 13:48:24

标签: php regex filtering extract

我想从网站中提取特定链接。

链接看起来像这样:

/topic/Funny/G1pdeJm

链接总是相同的 - 除了最后一个随机字符。

我很难将这些部分结合起来

(preg_match("/^http:\/\//i",$str) || is_file($str))

(preg_match("/Funny(.*)/", $str) || is_file($str))

第一个代码提取每个链接 链接的第二个摘录只有/ topic / Funny / * part。

不幸的是,我无法将它们组合在一起,我也想阻止这些标签:

/topic/Funny/viral
/topic/Funny/time
/topic/Funny/top
/topic/Funny/top/week
/topic/Funny/top/month
/topic/Funny/top/year
/topic/Funny/top/all

有什么想法吗?

谢谢,Chim

1 个答案:

答案 0 :(得分:1)

您可以尝试使用否定前瞻来“过滤掉”您不喜欢的网址:

.*\/Funny\/(?!viral|time|top\/week|top\/month|top\/year|top\/all|top(\n|$)).*

demo here