我目前有一个脚本会抓取雅虎等来提取链接。它正在工作但是我试图爆炸并摆脱http://关闭链接和/或结束(在/之后的任何事情)。
if ($href->getAttribute('class') == 'yschttl spt') {
$link = explode('?', urldecode(array_pop(explode('**', $href->getAttribute('href')))));
$urls[] = $link[0];
}
我之前没有真正使用过爆炸,所以我只是以某种方式删除整条线。上面的示例返回所有url:
例如。但是我需要它返回:
finance.yahoo.com
中的代码