我想在Google上进行一些搜索,以便阅读有关自定义搜索字词的最新消息,并使用BeautifulSoup
的简单请求来解析html。
import requests
from bs4 import BeautifulSoup
response = requests.get("https://www.google.com/search?q=roger+federer&hl=en?cr=countryGB?as_qdr=y")
page = BeautifulSoup(response.content, "lxml")
特别是,我只想搜索英语新闻(GB或US是相同的)但我也得到意大利语的结果(我在意大利......)。
我该如何避免它?
最终,是否有为此目的编写的包/ API /工具? (我知道Google关闭了官方API)。