我有超过20k的链接要检查。 那些是rapidshare和fileserve链接。 现在我正在使用'file_get_content'并检查fileserve链接内容是否包含'此文件是否违反版权所有者或被上传者删除。'将其标记为“已删除”和“未找到文件”。为了链接。
if (strpos($var2, "This file was either in breach of a copyright holder or deleted by the uploader.")) {...
if (strpos($var, "File not found.")) {...
事情是file_get_content确实非常慢,即使我添加了这个:
$context = stream_context_create(array('http' => array('header'=>'Connection: close')));
$var = file_get_contents($url,false,$context);
如果还有其他替代方法可以更快地完成吗? 脚本运行超过一个小时,我检查了5k链接......
答案 0 :(得分:0)
你是否尝试多线程和其他语言如C进行检查?
答案 1 :(得分:0)
这两项服务都向公众提供API,阅读他们的文档。