最近,我使用IMDBpy API来抓取IMDB数据集。在此API中,有一个imdbpy2sql.py可以将IMDB影片数据集转换为SQL数据库。 但是我找不到这个数据集的任何描述。所以我无法理解这个SQL数据库的架构。此数据库中有太多表。有什么方法可以知道吗?
我严格按照此网站建立我的数据库http://blog.secaserver.com/2013/08/importing-imdb-sample-data-set-mysql/。
非常感谢!!
答案 0 :(得分:9)
我怀疑桌子太多了。有很多属性/关系。
我在创建pyIRDG时生成一次。您还可以查看该代码以获取有关可用数据的文档。以下是评论的输出:http://pastebin.com/zGnZ02w4
我还使用MySQL Workbench从db生成模式。
此German blog article还有an ERM image http://meolus.de/fileadmin/images/meolus/blog/imdb-erm.png。
不是我意识到的,而且我们的数据库肯定不在任何NF中。 :-) 无论如何,你可以很容易地看到该计划 imdb / parser / sql / dbschema.py模块或直接使用一些工具 数据库。 Source