我已从此链接下载了完整的RDF Freebase转储文件'freebase-rdf-2012-12-09-00-00.gz'(7.5GB)http://download.freebaseapps.com/
此数据转储使用此处定义的Turtle RDF语法http://wiki.freebase.com/wiki/Data_dumps
如何将此文件加载到Virtuoso(06.04.3132)?
我尝试使用此命令
SQL> DB.DBA.TTLP_MT (file_to_string_output ('freebase-rdf-2012-12-09-00-00.gz'), '', 'http://freebase.com');
但它在短时间内完成。以下请求仅从源文件返回2行(三元组),日志中没有例外。
SELECT ?a ?b ?c from <http://freebase.com> where {?a ?b ?c}
http://rdf.freebase.com/ns/american_football.football_historical_roster_position.number
http://rdf.freebase.com/ns/type.object.name Number
http://rdf.freebase.com/ns/american_football.football_historical_roster_position.number
http://rdf.freebase.com/ns/type.object.type http://rdf.freebase.com/ns/type.property.
2 Rows. -- 78 msec.
顺便说一下,加载这么大的文件(8 GB RAM或24 GB RAM)需要多长时间?
这个转储文件是否可以在TDB(通过tdbloader),Sesame OpenRDF(通过加载)或OWLIM SE存储库中加载而无需修改?
在合理的时间内加载后,我会从SELECT SPARQL查询(不是非常复杂)得到响应吗?
谢谢!
答案 0 :(得分:2)
我收到了[freebase-discuss]邮件列表的回复:
此Freebase转储应该通过修复脚本解压缩,拆分并运行。更多细节在这里
http://people.apache.org/~andy/Freebase20121223