尝试编写一个程序以从Google抓取电影信息

时间:2019-05-05 22:22:47

标签: python excel web-scraping

我正在尝试为我的朋友们编写一个程序,以跟踪我们已观看的电影并保留我们要观看的电影列表。

我想做的是用Python编写一个程序,该程序获取电影标题并将该电影添加到excel中的列表中,然后在google中搜索来自各种来源的关于该电影的信息,并将其添加到excel文档中(例如,如果我在Python中输入“回到未来”,它将其添加到我的excel文档的第一列中,然后在Google中搜索“回到未来”的评分,并从Google的框中从IMDB,烂番茄和Metacritic中获取它们会在搜索的一侧显示所有电影信息。)

我已经将用于输入电影标题的代码编写到excel中,但是完全不知道从何处开始获取Google的电影分级,我们将不胜感激。

更新:能够弄清楚,如果有人感兴趣,这是工作代码:

addWord(...)

1 个答案:

答案 0 :(得分:2)

首先,我建议反对从Google(或与此有关的任何搜索平台)中抓取任何东西。这很可能会将您的IP列入黑名单(请参阅另一篇stackoverflow帖子(is-it-ok-to-scrape-data-from-google-results)。如果您打算继续前进,应该考虑使用duckduckgo.com作为替代方案。

话虽如此,我将首先使用requests python库尝试OMDB Api。他们有一个相当完善的电影作品数据库,可以满足您的要求。