为电影预告片爬行IMDB?

时间:2018-04-21 15:24:00

标签: python youtube web-crawler

我想抓取IMDB并下载符合某些条件的电影预告片(来自YouTube或IMDB)(例如:今年发布,评分高于2)。

我想在Python中执行此操作 - 我看到有用于抓取IMDB和下载YouTube视频的软件包。问题是,我目前的计划是抓取IMDB,然后在youtube上搜索' $ movie_name' +'预告片'并希望最好的结果是预告片,然后下载它。

尽管如此,这似乎有点令人费解,我想知道是否有更简单的方法。

任何帮助都将不胜感激。

2 个答案:

答案 0 :(得分:1)

没有更简单的方法。我怀疑IMDB允许人们自由地废弃他们的网站,因此您的IP可能会被列入黑名单并反击您需要代理。祝你好运,敬畏。

答案 1 :(得分:0)

imdbpy API https://imdbpy.github.io/将使您入门,这非常简单。

  import imdb # pip install IMDbPY
  ia = imdb.IMDb()
  list_of_movies = ia.search_movie("string text")
  [ia.(m, info=['main','votes']) for m in list_of_movies[:1]]
  for m in list_of_movies[:1]:
    yt_search_term = m.get("name") + "trailer"
    # connect to YT API to start that part of the search.

然后查找如何使用适当的身份验证连接到YTv3 API并下载相应的Google客户端API-Sample code here

问题:一个挑战是电影的标题不是唯一的,因此通过name+" trailer"搜索YouTube不一定会返回您想要的预告片。因此,您需要以某种方式解决这一问题。对于新的好莱坞大片(或类似电影),您可能会成功。

法律:如另一个答案所示,请确认您的用例符合您所使用的技术和信息服务的条款和条件以及许可使用。如有疑问,请先征得这些当事人的同意或寻求专业的法律意见。