我想从网站中提取特定链接。
链接看起来像这样:
/topic/Funny/G1pdeJm
链接总是相同的 - 除了最后一个随机字符。
我很难将这些部分结合起来
(preg_match("/^http:\/\//i",$str) || is_file($str))
和
(preg_match("/Funny(.*)/", $str) || is_file($str))
第一个代码提取每个链接 链接的第二个摘录只有/ topic / Funny / * part。
不幸的是,我无法将它们组合在一起,我也想阻止这些标签:/topic/Funny/viral
/topic/Funny/time
/topic/Funny/top
/topic/Funny/top/week
/topic/Funny/top/month
/topic/Funny/top/year
/topic/Funny/top/all
有什么想法吗?
谢谢,Chim
答案 0 :(得分:1)
您可以尝试使用否定前瞻来“过滤掉”您不喜欢的网址:
.*\/Funny\/(?!viral|time|top\/week|top\/month|top\/year|top\/all|top(\n|$)).*