为关键字搜索前10个搜索链接的Google搜索页面

时间:2010-09-02 12:07:48

标签: web-scraping webharvest

我想在搜索关键字时从谷歌页面搜索前10个搜索链接。

我正在使用webharvest。计划刮掉href链接并使用一些

过滤掉前10名

属性模式?这是正确的方式,它目前还不起作用。还有其他简单的方法吗? :(

2 个答案:

答案 0 :(得分:1)

如何将Google搜索REST API用作described here

答案 1 :(得分:0)

使用Google表格更容易(即使您可以监控更改),但您可能有理由选择外部工具。

一般来说,get results需要3个功能:

extract Title "//h3[@class='r']"
extract  URL "//h3/a/@href"
clean URL "\/url\?q=(.+)&sa" - (All external URLs in Google Search results have tracking enabled and we’ll use Regular Expression to extract clean URLs)