如何从Google搜索结果中排除网页列表?

时间:2018-05-27 18:41:06

标签: python google-sheets google-search google-custom-search

“减号”符号不适合,因为该列表包含~2000个条目。 我只是python的初学者,所以,如果可能的话,请解释为5岁 非常感谢你!

1 个答案:

答案 0 :(得分:0)

据推测,您正在从Python程序中获取Google搜索结果。因此,您可以在阅读结果时在Python程序中排除列表中的网页,而不是尝试让Google为您执行此操作。您可以使用函数编程技术,例如为此调用filter

理想情况下,您可以通过比较链接的网址来实现此目的,但如果您愿意牺牲准确性,则可以通过比较链接的标题来实现,如果您的列表中只有标题而不是网址。但是URL确实更适用于此目的。

因此,您可以使用像Beautiful Soup这样的库来解析Google搜索结果,提取链接的网址,并过滤掉(使用filter)与您列表中的任何网址相同的网址(您可以使用def定义一个函数,以检查给定的URL是否在您的列表中。你必须要小心,因为有时谷歌搜索结果链接是通过谷歌网站进行重定向到真实网址,以进行排名。