使用PHP从提交的URL复制Digg的图像建议

时间:2009-06-06 14:00:42

标签: php image-manipulation web-crawler digg

所以我正在寻找关于如何最好地复制digg上看到的功能的想法。基本上,你提交你感兴趣的页面的URL,然后抓取DOM然后抓取所有的IMG标签(可能只选择一些高于某个高度/宽度的标签)然后从它们创建一个缩略图并询问你哪个您想代表您的提交。

虽然那里有很多事情,但我主要对从提交的页面中检索图像的最佳方法感兴趣。

3 个答案:

答案 0 :(得分:1)

虽然您可以尝试解析网页,但HTML可能会如此混乱,以至于您最好使用接近但不完美的内容。

  1. 提取看起来像图像标记引用的所有内容。
  2. 尝试获取网址
  3. 检查您是否有图像
  4. 只是寻找并捕获src =“...”的内容会让你到那里。处理相对与绝对图像引用的一些基本操作,你就在那里。

    显然,只要您从第三方按需提取网络资产,您就需要小心,不会被滥用。

答案 1 :(得分:0)

我建议使用cURL + regexp。

答案 2 :(得分:0)

您还可以使用PHP Simple HTML DOM Parser来帮助您搜索所有图片代码。