IMDb数据集可查找电影的10个评级数

时间:2016-09-19 15:08:16

标签: python database web-scraping

我正在尝试根据他们获得的(评级为10)票的数量对IMDb电影进行排序。
不幸的是,我似乎无法在他们的FTP服务器上的公共数据集中找到这条信息(它不在评级文件中。) 我正在尝试提取的信息示例: The Shawshank Redemption获得955769票,评分为10 有没有其他办法可以做到这一点? IMDbPy能帮忙吗?

1 个答案:

答案 0 :(得分:0)

您应该可以使用IMDbPY包来获取评级信息。

按照链接IMDbPY中显示的步骤进行操作。

你实际上可以用两种方式来做,

  1. 使用提供的 api 这是一种简单的方法(适用于api调用次数较少的情况)。
  2. 但是如果您有多个api调用,则需要创建本地IMDb数据库。您可以通过运行IMDbPY提供的python脚本来完成此操作,该脚本会自动为您在数据库中创建表格(按照上述步骤here执行)。
  3. 其他方式(不推荐)是通过创建一个网络刮刀,这是一个痛苦的过程。可以在python中使用 requests beautifulsoup 包构建一个。