Freebase:什么数据转储文件包含“imdb_id”?

时间:2012-07-15 14:24:16

标签: database api freebase mql imdb

我运行IMDbAPI.com并一直使用Bing的Search API从标题搜索中查找IMDb ID。 Bing目前正在将其API更改为Azure Marketplace(8月1日),并且不再免费提供。我开始使用Freebase测试我的API来解析这些ID并在前8小时达到他们的100k限制(我的网站目前每天获得大约300万个请求,但标题搜索只有200-300k)

这正是他们提供数据转储文件的原因,

我下载了Film文件夹中的大部分文件,但无法找到存储“/ authority / imdb / title”imdb id命名空间数据的位置。

https://www.googleapis.com/freebase/v1/mqlread?query={"type":"/film/film","name":"True%20Grit","imdb_id":null,"initial_release_date>=":"1969-01","limit":1}

这就是我目前正在访问ID的方式。

有谁知道哪个文件包含此信息?以及如何从电影标题/ id链接回来?

2 个答案:

答案 0 :(得分:7)

imdb_id属性由/authority/imdb/title命名空间中的键支持,因此您正在查找该行:

/m/015gxt       /type/object/key        /authority/imdb/title   tt0065126

在文件http://download.freebase.com/datadumps/latest/freebase-datadump-quadruples.tsv.bz2

这是一个4 GB的文件,因此请准备等待一段时间进行下载。请注意,所有内容都由MID键入,因此如果您的数据库中没有它,则需要首先计算出来。

使用MQL而不是数据转储的等效查询是https://www.googleapis.com/freebase/v1/mqlread?query=%7B%22type%22%3a%22/film/film%22,%22name%22%3a%22True%20Grit%22,%22imdb_id%22%3anull,%22initial_release_date%3E=%22%3a%221969-01%22,%22mid%22:null,%22key%22:[{%22namespace%22:%22/authority/imdb/title%22}],%22limit%22:1%7D&indent=1

编辑:p.s.我很确定Browse目录中的文件会消失,所以即使你能在那里找到信息,我也不会依赖它们。

答案 1 :(得分:0)

之前的答案很好,只是这种查询的更快版本可能是:

query = [{
          'type': '/film/film',
          'name': 'prometheus',
          'imdb_id': null,
          ...
        }];

没有提及MQL请求的其余部分,因为它与前面提到的没有区别。希望有所帮助。