PHP爆炸,从搜索引擎中获取URL

时间:2012-12-02 17:13:20

标签: php url explode web-crawler

我目前有一个脚本会抓取雅虎等来提取链接。它正在工作但是我试图爆炸并摆脱http://关闭链接和/或结束(在/之后的任何事情)。

if ($href->getAttribute('class') == 'yschttl spt') {
                $link = explode('?', urldecode(array_pop(explode('**', $href->getAttribute('href')))));
                $urls[] = $link[0];
            }

我之前没有真正使用过爆炸,所以我只是以某种方式删除整条线。上面的示例返回所有url:

http://finance.yahoo.com/q

例如。但是我需要它返回:

finance.yahoo.com

我正在使用http://aroussi.com/freebies/scraper/dl/fus1.zip

中的代码

0 个答案:

没有答案