我正在尝试使用py-web-search模块从Google搜索中提取信息。拉动搜索的结果就是这个(如Github中所述):
{
'url': '...',
'expected_num': 5,
'received_num' : 5, # There will be a difference in case of insufficient results
'start': 2,
'search_engine': 'google',
'total_results': ...,
'results':
[
{
'link': '...',
'link_text': '...',
'link_info': '...',
'related_queries': [...],
'additional_links':
{
linktext: link,
...
}
},
...
]
}
我似乎无法弄清楚如何打印'链接'数据。
result=Google.search(query='hello world', num=5, start=0, country_code="es")
data=result['results']
print(data)
这是我的测试代码,仅打印[]
。有什么建议吗?
答案 0 :(得分:6)
您正在做的是正确的,但该库已过时,并且不会返回任何Google搜索结果。有关详细信息,请参阅this issue:
此外,谷歌已经改变了HTML结构。所以刮刀必须更新。感谢错误报告!
作为临时解决方法,您可以考虑使用Bing作为搜索引擎,因为它仍然有效:
from pws import Bing
result = Bing.search('hello world', 5, 2)
print(result["results"])