我可以从一个网站复制到localhost

时间:2011-11-04 16:59:29

标签: php copy web-crawler

我写了一个爬虫程序,它将抓取网站中的所有页面并下载所有pdf和doc文件。现在我想在下载时对pdf和doc文件进行排序。所以我尝试创建文件夹,然后在该网站中复制这些文件。但我无法复制。错误是我没有权限。是否有任何替代排序和下载。

这是我选择所有链接的方式

  $original_file    = file_get_contents($link);
                        $stripped_file  = strip_tags($original_file, "<a>");
                        preg_match_all("/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is", $stripped_file, $matches);
                        return $matches['1'];

0 个答案:

没有答案