我运行IMDbAPI.com并一直使用Bing的Search API从标题搜索中查找IMDb ID。 Bing目前正在将其API更改为Azure Marketplace(8月1日),并且不再免费提供。我开始使用Freebase测试我的API来解析这些ID并在前8小时达到他们的100k限制(我的网站目前每天获得大约300万个请求,但标题搜索只有200-300k)
这正是他们提供数据转储文件的原因,
我下载了Film文件夹中的大部分文件,但无法找到存储“/ authority / imdb / title”imdb id命名空间数据的位置。
这就是我目前正在访问ID的方式。
有谁知道哪个文件包含此信息?以及如何从电影标题/ id链接回来?
答案 0 :(得分:7)
imdb_id
属性由/authority/imdb/title
命名空间中的键支持,因此您正在查找该行:
/m/015gxt /type/object/key /authority/imdb/title tt0065126
在文件http://download.freebase.com/datadumps/latest/freebase-datadump-quadruples.tsv.bz2
中这是一个4 GB的文件,因此请准备等待一段时间进行下载。请注意,所有内容都由MID键入,因此如果您的数据库中没有它,则需要首先计算出来。
编辑:p.s.我很确定Browse目录中的文件会消失,所以即使你能在那里找到信息,我也不会依赖它们。
答案 1 :(得分:0)
之前的答案很好,只是这种查询的更快版本可能是:
query = [{
'type': '/film/film',
'name': 'prometheus',
'imdb_id': null,
...
}];
没有提及MQL请求的其余部分,因为它与前面提到的没有区别。希望有所帮助。