从Google搜索获取网址和标题

时间:2011-02-11 23:26:23

标签: http url google-search

从给定的Google搜索字词中获取网址和标题的最简单方法是什么?我只想用一个特定的术语做一次,我想获得所有的URL /标题,而不是前10个。如果有办法让响应分隔(例如以CSV格式),那将是理想的。

我不是要重新发明轮子,但如果这是必要的我就是游戏(我在Windows机器上,我可以用PHP编写脚本)。我只是在寻找最快,最可靠,最常见的方法。

更新:到目前为止,这些建议似乎需要适量的编码,既可以解析HTML / XML,也可以循环遍历结果集(提升起始变量,点击“下一步”) 。是不是有现成的程序来快速做到这一点?

2 个答案:

答案 0 :(得分:0)

答案 1 :(得分:0)

有很多方法可以做到这一点。你说你懂PHP,为什么不使用cURL和一些正则表达式?

<?php
$c = curl_init();
curl_setopt($c, CURLOPT_URL, "http://www.google.com/search?q=[search term here]&start=0");
curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec($c);
curl_close($c);
?>

结果来源将是$ data。从那时起,您可以使用preg_match()收集所需的URL并将其存储在数组中。或者,您可以尝试XML parser以获得更清洁的方法。

请注意,您可以修改start = 0以返回其他结果。