我一直在试图弄清楚如何安装一个SPARQL端点几天,但是尽管我读到了我无法理解它。
评论我的意图:我在CKAN上安装了一个开放数据服务器,我的目标是能够对数据使用SPARQL查询。我知道我不能直接对数据集本身进行操作,我必须定义自己的OWL并将我想要使用的数据从CSV格式(它们当前的格式)转换为RDF三元格式(将是用作链接数据。)
我们的想法是首先使用扩展程序ckanext-dcat自动生成的存储库元数据进行测试,但我真的找不到从哪里开始。我已经搜索了有关如何为SPARQL安装Virtuoso服务器的信息,但是我发现的信息还有很多不足之处,并不是说我无法解释如何能够真正介绍我自己的OWL和RDF进入Virtuoso本身。
有人可以帮助我知道如何开始吗?谢谢
答案 0 :(得分:3)
我有点困惑。也许这是两个或更多的问题?
1。如何将表格数据(如CSV)转换为RDF语义格式?
可以使用 R2RML 方法完成此操作。 Karma是一个很棒的GUI用于此目的。就像你说的那样,使用底层的OWL本体可以真正改善这样的转换。但它也可以在不创建自定义本体的情况下完成。
I have elaborated on this in the answer to another question.
2。既然我有一些RDF格式的数据,我怎样才能用SPARQL端点公开它?
Virtuoso是一个合理的选择。有多种方法可以部署它和多种方式来加载数据,因此有很多关于这个主题的教程。 Here's one good one, from DBpedia.
如果您希望使用SPARQL端点启动RDF三元组的更简单的路径,Stardog和Blazegraph可用作JAR,RDF4J可以轻松地部署在像Tomcat这样的容器中。
除了SPARQL REST端点之外,所有提供基于Web的图形界面,用于加载数据和运行查询。至少Stardog还提供批量加载的命令行工具。