我写了一个爬虫程序,它将抓取网站中的所有页面并下载所有pdf和doc文件。现在我想在下载时对pdf和doc文件进行排序。所以我尝试创建文件夹,然后在该网站中复制这些文件。但我无法复制。错误是我没有权限。是否有任何替代排序和下载。
这是我选择所有链接的方式
$original_file = file_get_contents($link);
$stripped_file = strip_tags($original_file, "<a>");
preg_match_all("/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is", $stripped_file, $matches);
return $matches['1'];