抓刮的麻烦

时间:2009-10-10 05:10:27

标签: php screen-scraping

我正在尝试从文本文件列表中删除某些页面,并将其保存到我的服务器上。

我有以下代码(域名被遮挡),从文件目录的文本文件列表中剔除,然后复制文件名,但附加了.html。

出于某种原因,它创建文件时实际上没有成功写入文件。我究竟做错了什么?

<?php
$file = fopen("list.txt","r");

while(! feof($file))
  {
 $line = fgets($file);
$url = "http://www.????.com". $line;
$homepage = @file_get_contents($url);
$newname = rtrim(substr(strrchr($line, "/"), 1)) . ".html";
$fh = fopen($newname, 'w') or die("can't open file");
$stringData = $homepage;
fwrite($fh, $stringData);
fclose($fh);

  }

fclose($file);
echo "success!";
?>

1 个答案:

答案 0 :(得分:1)

你应该在file_get_contents之前删除@。如果它给你一个错误,@将阻止它显示。

也许您没有安装fopen包装器,或者网址返回404.除非您看到该通话中的警告或错误,否则无法判断。