我写了一个PHP脚本来抓取亚马逊产品的产品评论页面链接。但是,我无法浏览产品页面。 [亚马逊每页仅显示12个产品]。
我的脚本使用Simple HTML Dom Parser。
这是我的脚本的一部分,它跟随到下一页产品的链接:
if($nextPage=$html->find('#pagnNextLink',-1)) {
$next = "http://amazon.com".$nextPage->href;
// This works:
// $next = "http://www.amazon.com/s/ref=sr_pg_2/179-2481337-1920701?rh=n%3A2625373011%2Cn%3A%212625374011%2Cn%3A2649512011%2Cp_n_date%3A2693527011%2Cp_n_theme_browse-bin%3A2650365011%2Cp_n_format_browse-bin%3A2650305011&page=2&ie=UTF8&qid=1372370539";
echo "<p>".$next;
getProducts($next);
}
问题: 最初加载到函数的基页继续加载,并且不访问当前页面中找到的下一页链接。
然而,注释行在上面的代码片段中有效。 :\ 有任何想法吗?
答案 0 :(得分:0)
您的id
错误
<a title="Next Page" id="pagnNextLink" class="pagnNext" href="/s/ref=sr_pg_2?rh=i%3Aaps%2Ck%3Atoothbrush&page=2&keywords=toothbrush&ie=UTF8&qid=1372374734">
<span id="pagnNextString">Next Page</span>
<span class="srSprite pagnNextArrow"></span>
</a>
正确的ID应为#pageNextLink