连接到IMDB

时间:2008-09-19 07:36:37

标签: web-services imdb

之前有没有人这样做过?在我看来,应该有一个Web服务,但我找不到。我正在编写一份个人使用的应用程序,只显示IMDB的基本信息。

10 个答案:

答案 0 :(得分:17)

IMDb的库目前似乎非常不可靠,效率极低。我真的希望IMDb能够创建一个Web服务。

经过一番搜索后,我找到了IMDb的合理替代方案。它提供所有基本信息,如概述,年份,评级,海报,预告片等:

The Movie Database (TMDb)

它提供了一个wrappers for several languages的网络服务,到目前为止似乎可靠。对我来说,搜索结果也更准确。

答案 1 :(得分:14)

没有可用的网络服务。

但是,每种语言都有足够的html抓取器来满足您的需求!

我在一些个人项目中使用了.NET 3.5 Imdb Services opensource project

1分钟谷歌搜索结果:

答案 2 :(得分:8)

IMDb发布的唯一“API”是一组包含演员,导演,电影等格式化列表的plain-text data files。您可能需要编写自己的解析器,除非有人为您的语言发布了一个。尝试谷歌搜索,如“imdb api”和“imdb解析器”。

屏幕抓取工具可能很有用,但它们在使用条款中具体prohibit scrapers

答案 3 :(得分:5)

以下是我自己使用RegEx的解决方案:

private const string UglyMovieRegex = "(?<=5>|3>)(Cast|Director:|Fun\\sStuff|Genre:|Plot:|Runtime:|Tagline:|Writers:)"
                                                + "|href=\"[\\w\\d/]+?(Genres|name|character)/([\\w]+?)/\".*?>([.\\-\\s\\w]+)</a>"
                                                + "|(?<=h\\d>)([.\\w\\s'\\-\"]+)(?=<a\\sc|</d|\\|)";

Regex MovieData = new Regex (UglyMovieRegex, RegexOptions.Compiled | RegexOptions.Multiline | RegexOptions.Singleline );

答案 4 :(得分:5)

虽然这是两年前发布的,但这是一个简单的python代码

import urllib2

movie_id = raw_input('Enter the ID of the movie: ')
json = urllib2.urlopen('http://imdbapi.com/?i=' + movie_id + '&r=json')

print json.read()

另存为imdb.py,然后在shell或终端或其他任何

中运行

如果你想要xml数据只需用jml替换json

请注意,这是使用imdbapi.com网站返回json结果访问该网站以查看更多选项。

答案 5 :(得分:4)

IMDB禁止使用刮刀,并且每隔一段时间更改一次页面布局,因此解析HTML是一种选择,但要准备好每年调整一次代码2-3次(在那里,完成,放弃)。他们确实有一个收费服务,可以完全访问数据,但你还需要解释它的用途,并说服他们你没有建立一个有竞争力的网站(我有一个链接,但似乎已经改变,现在找不到。)

答案 6 :(得分:2)

另一种方法是在本地计算机上运行IMDB数据库。 Java Movie Database导入IMDB数据库文件,转换它们并提供本地可访问的IMDB副本。 IMDB具有Java电影数据库没有的一些功能,反之亦然,但如果您正在寻找的是快速访问所有数据,那么尝试一下就值得一试。

答案 7 :(得分:2)

现在有一个(未记录的)API,如http://www.imdb.com/xml/find?json=1&q=Harry+Potter。见Does IMDB provide an API?

答案 8 :(得分:1)

TRYNT Heavy Technologies提供(免费)用于检索基本IMDb数据的网络服务 - 在http://www.trynt.com/trynt-movie-imdb-api/查看他们的网站。他们还有一个单独的电视数据服务。

答案 9 :(得分:0)

至少有一个称为IMDb8的非官方IMDb API。它有大约31个端点,包括

  1. 演员/今天出生的人
  2. actors / get-awards-summary
  3. 标题/获取图
  4. 标题/最重要的人

等像任何其他API一样,它非常易于使用。我使用此API构建了一个有趣的琐事项目。您可以找到有关如何get started here的教程。