无法使用模块" google"获得所需的Google搜索结果

时间:2015-12-16 03:40:12

标签: python python-2.7 html-parsing google-search

我一直试图废弃谷歌搜索数据。 让我解释一下到目前为止我做了什么。

我使用谷歌模块获取搜索结果,美丽的汤。下面我给出了我做过的样本搜索,

>>> from google import search
>>> 
>>> for i in search("tom and jerry", tld="co.in",num=10,stop=1): print i

https://www.youtube.com/watch?v=mugo5LoG8Ws
https://en.wikipedia.org/wiki/Tom_and_Jerry
http://www.dailymail.co.uk/debate/article-2390792/How-sense-humour-censor-Tom-Jerry-racist-By-Mail-TV-critic-CHRISTOPHER-STEVENS.html
http://edp.wikia.com/wiki/Tom_and_Jerry
https://www.youtube.com/watch?v=gSK5curwV_o
https://www.youtube.com/watch?v=xb8jTvSwJbw
https://www.youtube.com/watch?v=Kj8VuTr5q9g
https://www.youtube.com/watch?v=iIprJoPTJoI
https://www.youtube.com/watch?v=UaX3hvrZDJA
http://www.cartoonnetwork.com/games/tomjerry/
https://www.facebook.com/TomandJerry/
http://www.dailymotion.com/video/x2mn36a
http://www.dailymotion.com/video/x2p0k8j
>>> 

但是这个结果实际上与手动搜索结果不同。

Manual try of the same query/keyword

实际上它有何不同,如果我们对google库的 init .py文件进行任何更改,我们可以获得一些有效的结果吗?

请给我一个可能的方法..

提前致谢。

[注意]:已经在stackoverflow中浏览了之前的讨论。如果是Dup,我道歉...... :)

编辑1:我有时会得到重复的链接。第一个链接在我从google.search(* arg)命令得到的生成器输出中重复几次。请告诉我如何摆脱这个

我知道这个DUP是怎么来的。它是谷歌搜索页面中热门网站显示的子链接。 enter image description here

抱歉,像素太小了。 :)

详细研究API输出和解析输出的方式。感谢所有想过帮助我的人:)。

0 个答案:

没有答案