从给定的Google搜索字词中获取网址和标题的最简单方法是什么?我只想用一个特定的术语做一次,我想获得所有的URL /标题,而不是前10个。如果有办法让响应分隔(例如以CSV格式),那将是理想的。
我不是要重新发明轮子,但如果这是必要的我就是游戏(我在Windows机器上,我可以用PHP编写脚本)。我只是在寻找最快,最可靠,最常见的方法。
更新:到目前为止,这些建议似乎需要适量的编码,既可以解析HTML / XML,也可以循环遍历结果集(提升起始变量,点击“下一步”) 。是不是有现成的程序来快速做到这一点?
答案 0 :(得分:0)
您可以从Google搜索中返回xml数据:
查看http://www.google.com/cse/docs/resultsxml.html#XML_Results_for_Regular_and_Advanced_Search_Queries
答案 1 :(得分:0)
有很多方法可以做到这一点。你说你懂PHP,为什么不使用cURL和一些正则表达式?
<?php
$c = curl_init();
curl_setopt($c, CURLOPT_URL, "http://www.google.com/search?q=[search term here]&start=0");
curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec($c);
curl_close($c);
?>
结果来源将是$ data。从那时起,您可以使用preg_match()收集所需的URL并将其存储在数组中。或者,您可以尝试XML parser以获得更清洁的方法。
请注意,您可以修改start = 0以返回其他结果。