所以我正在寻找关于如何最好地复制digg上看到的功能的想法。基本上,你提交你感兴趣的页面的URL,然后抓取DOM然后抓取所有的IMG标签(可能只选择一些高于某个高度/宽度的标签)然后从它们创建一个缩略图并询问你哪个您想代表您的提交。
虽然那里有很多事情,但我主要对从提交的页面中检索图像的最佳方法感兴趣。
答案 0 :(得分:1)
虽然您可以尝试解析网页,但HTML可能会如此混乱,以至于您最好使用接近但不完美的内容。
只是寻找并捕获src =“...”的内容会让你到那里。处理相对与绝对图像引用的一些基本操作,你就在那里。
显然,只要您从第三方按需提取网络资产,您就需要小心,不会被滥用。
答案 1 :(得分:0)
我建议使用cURL + regexp。
答案 2 :(得分:0)
您还可以使用PHP Simple HTML DOM Parser来帮助您搜索所有图片代码。