所以我已经成功使用了SimpleHtmlDom。不同之处在于我基于url迭代了分页。 例如,域名将是:
www.example.com/articles
并且分页将是
www.example.com/articles/page/1.html
现在我有一个基于javascript的分页,我只得到第一页的结果。现在,当我告诉页面转到下一页时,我假设它重新加载页面,所以它从头开始,因为url不会改变。
另一个问题是属于“下一页”的链接,如果您将其复制并粘贴到网址栏上,那么它会将您重定向到网站的另一部分。 (对于开发人员来说太多了-_-)
我会实际粘贴原始代码,以便您可以自己查看链接的内容。
无论如何,我的问题如下:
我如何遍历整个分页?
<?php
require "simple_html_dom.php";
$url = "http://es.4story.gameforge.com/ranking/browse?type=world";
$baseUrl = "http://es.4story.gameforge.com/ranking/browse?type=world";
//Create a DOM object
$html = new simple_html_dom();
// Load HTML from a URL
$html->load_file($url);
// Get all links
foreach ($html->find('.enc_controls .enc_pager a.enc_next') as $anchor) {
$tempUrl = $baseUrl . $anchor->href;
$linkHtml = file_get_html($tempUrl);
foreach ($linkHtml->find('#results td .item_classWrap a span') as $item ) {
echo $item;
echo "<hr/>";
}
}