从链接中检索图像

时间:2011-12-02 09:42:09

标签: php image url

是否有脚本或服务或片段或方法或任何可以从网址获取缩略图的内容,缩略图我不是指网站的快照,而是可以自动获取并用作帖子缩略图的图像,非常类似于在facebook中使用的一个。应该提取图像,因此img src =“xxxxxxx?url = google.com”。这会获取谷歌徽标

1 个答案:

答案 0 :(得分:2)

也许现有解决方案,但实施起来并不困难:

  1. 您需要获取远程站点,例如file_get_contents
  2. 可选择使用Tidy来清理源HTML
  3. 如果您使用Tidy清理提取的数据,则
  4. 使用XML parser解析输出,或HTML parser
  5. 从网站上抓取第一个n图片(n应该是一个相对较小的数字)
  6. 将此获取的图像集存储在缓存中,因为此提取,解析可能需要一些时间
  7. 评论:

    • 您可以从网站上获取robots.txt以检查是否允许使用/索引内容
    • 设置此远程网站抓取的超时时间,因为如果网站停止或放慢,它也会在您的网站上超时
    • 限制并发提取到站点并全局以防止DoS-ing
    • 您可以使用HTTP客户端并限制获取的HTML数据大小,或者在下载实际内容(如果允许)之前使用HEAD HTTP方法获取Content-Length