如何抓取这种类型的网址

时间:2012-11-10 17:43:10

标签: php web-crawler

我正在使用PHP Simple HTML DOM Parser。 如何通过这样的URL抓取它。 http://www.example.com/categories/index.php?id= number from 1-1000&安培;文章

通过网址抓取应如下所示:

http://www.example.com/categories/index.php?id=1&article First URL
http://www.example.com/categories/index.php?id=2&article Second URL
http://www.example.com/categories/index.php?id=3&article Third URL
etc..

2 个答案:

答案 0 :(得分:1)

使用for声明?

在查询字符串中创建一个id = $id$id抓取的网页,并在下载后自动重新加载页面,每次递增$id直到1000?

答案 1 :(得分:0)

你可以导出post方法。如果你没有使用1-500之间的所有数字,那么必须使用explode和list

导出
<?php
list($a,$b,$c)=explode(' ','number from 1-5');
list($start,$end)=explode('-',$c);
for( $i=$start ; $i<=$end; $i++)
    echo "http://www.example.com/categories/index.php?id={$i}&article".'<br/>';
?>