带有URL PHP的Amazon Product数据段

时间:2018-07-07 13:44:03

标签: php web-scraping amazon


我想使用 PHP 取消产品信息,例如描述,标题,价格,数量等,并使用亚马逊网站中的产品网址或在ISBN上使用。
我该怎么办?有没有适合我的代码示例?
谢谢!

1 个答案:

答案 0 :(得分:1)

使用PHP,您可以通过使用file_get_contents()打开url以及使用带有正则表达式的preg_match()来完成工作。

然后,进入随机的文章页面并浏览其html代码,例如https://www.amazon.com/Learning-PHP-MySQL-JavaScript-jQuery/dp/1491978910/

通过检查代码,我们可以看到价格位于特定的<span>中:

<span class="a-size-medium a-color-price header-price"> 
    $35.00
</span>

然后我们可以做类似的事情:

$link = 'https://www.amazon.com/Learning-PHP-MySQL-JavaScript-jQuery/dp/1491978910/';
$page_content = file_get_contents($link);

if(preg_match('/<span class=\"a-size-medium a-color-price header-price\">(.*?)<\/span>/i',
    $page_content, $matches)) {

    $price = trim($matches[1]);
} else {
    echo "Price not found.";
    $price = 0;
}

这时您就有足够的基础来重复该操作,以获取需要获取的所有其他信息。

请注意,因为这假设文章之间的HTML模式始终相同,所以这并不是最好的相关方法。最好的相关方法是尽可能使用其API。