PHP file_get_html高级选项 - Web抓取

时间:2015-05-12 14:25:14

标签: php web-scraping

我为我的wordpress网站创建了这个功能,以便从供应商网页中获取特色图片 - 其中特色图像类是"设备图像"它工作正常,但有一个问题。

在我的许多目标$ url上有多种颜色的产品即时下载图片(即时通讯使用wp-all导入此功能),我的每个帖子标题都是'产品1绿色','产品1红色','产品2绿色','产品2红色'等

所以我需要增强此功能,根据我的产品名称下载正确的彩色图像 - 目标网址使用某种样本选择一种颜色,然后更改设备图像颜色。

问题是我的功能没有处理这个问题所以我需要让下面的功能通过样本切换以获得正确的设备图像(颜色),具体取决于我的产品标题,例如产品1绿色。我不确定我该怎么办......

目标网址示例:https://www.o2.co.uk/shop/phones/samsung/galaxy-s6-edge/#colour=sapphire-black&memory=128gb&contractType=paymonthly

下面的函数只是从device-image类的html中删除src。此外,URL似乎在其中有#colour选择器,但我无法选择它,因为我的数据源中不存在自己的颜色。

我需要筛选所有颜色并找到最符合我标题的正确颜色?我的问题是我得到了正确的图像,但颜色不正确。

//function to grab device image from supplier for wp all import featured images requires simple_html_dom.php

function gimage($url) {

include('library/simple_html_dom.php');

$html = file_get_html($url);

foreach($html->find('img.device-image') as $e)
   echo 'https://www.o2.co.uk'.$e->src;
}   

//recall function

gimage("INSERT_PAGE_URL");

0 个答案:

没有答案