使用pycurl获取下一页谷歌搜索结果

时间:2011-10-02 16:10:03

标签: html-helper pycurl

我已经编写了使用pycurl在google上搜索内容的代码。我希望能够使用pycurl来做到这一点,但非常感谢所有的帮助。我正在寻找能够搜索一个术语,然后“点击下一页按钮”或“点击底部的索引数字”使用pycurl,这样我就可以得到更多,然后只是前10个网页结果。

提前致谢。

1 个答案:

答案 0 :(得分:2)

有多种方法可以做到这一点。

如果您的基本网址为http://www.google.co.uk/search?hl=en&q=YOUR_QUERY_STRING

您可以在网址末尾添加& num = 100,以获得前100个结果。

或者如果您可以添加& start = N,其中N是10的倍数,并重新发送webrequest以获取下一页

或者您只需使用XPATH来解析网页,并在搜索结果中获取下一页的网址。