我当前的程序是：

#qt is my keyword 
values = {'q': qt}
data = urllib.parse.urlencode(values)
url = "http://www.google.fr/search?" + data
req = Request(url, headers={'User-Agent': 'Mozilla/5.0'})
response = urlopen(req).read().lower()
soup = BeautifulSoup(response, "lxml")
resp = soup.get_text()

count = sum(1 for _ in re.finditer(r'\b%s\b' % re.escape(unidecode.unidecode(word)), str(resp)))

unidecode用于删除带重音符号的字符，以避免错误。我认为速度更快，但我没有找到

谢谢

Answer 1

简单的拆分即可快速给出您要搜索的答案。使用SoupStrainer并让python3自己做unicode的东西可能也会改善，但不会改善

soup = BeautifulSoup(response, "lxml", parse_only=SoupStrainer(id="rso"))
resp = soup.get_text()
count2 = len(resp.split(word))-1

在Google研究中算字的最快方法？

我当前的程序是：

1 个答案: