我想使用PHP脚本创建搜寻器

时间:2019-04-09 05:56:36

标签: php web-crawler

我想为网站创建一个PHP脚本。我只想从该链接中找出链接。 例如,我有http://example.com链接,我的搜寻器应在后台打开该链接,并找到与http://example.com/[any名称] /评论匹配的所有链接。 我尝试过正则表达式,但是没有用,有人可以帮我吗。

<?php
$url="https://clutch.co/it-services";
$contents =file_get_contents($url);
$pattern = "https://clutch.co/profile/".'/^[a-zA-Z ]*$/'."#review";
$pattern = preg_quote($pattern, '/');
if(preg_match_all($pattern, $contents, $matches)){
   echo "Found matches:\n";
   foreach ($matches[0] as $urls) {
    echo $urls;
  }
}
else{
   echo "No matches found";
}
?>

1 个答案:

答案 0 :(得分:0)

regex模式存在一些语法问题:

定界符/必须在模式之外,并且该模式(“ https://”)中的定界符和特殊字符(.)必须被转义(“ https:\ / \ /“)

因此模式应为:

/https:\/\/clutch\.co\/profile\/[a-zA-Z ]*#review/

一个正则表达式小提琴:https://regex101.com/r/OEUQOU/1