来自其他网站的报废图像的自动基本网址

时间:2015-11-21 14:53:39

标签: php web-scraping base-url

使用HTML DOM Parser,我从外部网站获取图像(og:image或first avaialble image),

$site_image = ($html->find('meta[property="og:image"]', 0)) ? ($html->find('meta[property="og:image"]', 0)->content) : "";
// If og:image tag is not present get the first image
if($site_image=="") $site_image = ($html->find('img', 0)) ? ($site_image = $html->find('img', 0)->src) : "";

该代码适用于从网站检索图像,但谷歌除外。

Google source code

正如您在图片中看到的那样,Google正在使用没有基本网址的图片。在PHP中,是否有可能使用正确的基本URL来获取'src'?

所以它应该是 http://www.google.co.in/images/nav_logo242.png

0 个答案:

没有答案