是否存在使用freebase数据转储创建类似于freebase提供的数据库的现有方法,但是在您自己的服务器上?几乎是freebase但是在本地而不是通过API?
我想可以创建,但是现在有没有现成的解决方案?或者不使用API的类似数据的替代解决方案?我没有为dbpedia找到这个:|
答案 0 :(得分:7)
freebase-quad-rdfize的替代方法是:https://github.com/castagna/freebase2rdf
我使用Apache Jena的TDB存储来加载RDF数据,使用Fuseki通过HTTP上的SPARQL协议来提供数据。
另见:
此外,您现在有另一种选择:http://basekb.com/
答案 1 :(得分:3)
查看Google代码上的freebase-quad-rdfize项目。它应该允许您下载每周Freebase quad dump并将其加载到您选择的RDF三重存储中。
答案 2 :(得分:3)
我是:BaseKB的创建者,这是第一次将Freebase转换为RDF。
Freebase四重转储中存在关键完整性问题,这使得很难从四重转储中获得完全正确的结果。 :BaseKB重建Freebase的关键结构,以便保持唯一名称假设。这很重要,因为编写像SQL查询一样工作的简单SPARQL查询的能力取决于此。
目前,:BaseKB存在两个版本。这是一个免费版本,包含1.2亿个关于400万个主题的事实(来自维基百科的主题),还有一个" Pro"包含所有内容的版本。
关于Phillip Kendall提出的性能问题,我可以说它主要是拥有足够的RAM。凭借24GB的RAM,我可以在一小时内将免费版加载到三重存储中。有些查询的时间比我想要的要长,但整体查询性能都很好。
任何想要使用" Pro"版本将需要异常强大的硬件,并将花费大量的精力让他们的工具链工作。我现在正与合作伙伴合作,以实现" Pro"以令人满意的方式向用户提供。
答案 3 :(得分:2)
将数据导入您选择的三重商店并不难 - 但除非您做的事情微不足道,否则在合理的时间内获得任何答案都会遇到很大困难。
几年前有人确实将整个数据集导入MySQL - 加载需要2周时间甚至简单的查询,例如“作为一个人输入的内容的数量”需要> 1分钟才能给出答案。这是在大硬件上,数据集现在比以前大得多。
答案 4 :(得分:1)
如果您可以将数据库导出为TXT或数据库文件(如MDB,XLS或任何其他高度可传输的数据格式)中的说明,制表符分隔或逗号分隔值,则可以在您的数据库上构建自己的MySQL数据库。计算机使用该数据。主要是确保您可以导出数据,您可以从中重建自己的数据库。