将RDF编写的字符串写入sesame存储库

时间:2015-05-20 12:03:51

标签: java rdf sesame

我无法想象如何将一些RDF N3格式化的字符串(&#39; s)写入我的芝麻回购。我有以下ArrayList<String>,其中包含每个索引的以下文本行(一行以;结尾):

@prefix gstruct: <http://cs.lth.se/ontologies/gstruct.owl#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .

gstruct:sentence_1  rdf:type    gstruct:Sentence ;
    gstruct:inx 1 ;
    gstruct:words
        [gstruct:id 1 ; gstruct:form "The" ; gstruct:lemma "the" ; gstruct:pos "DT" ; gstruct:head "4" ; gstruct:deprel "NMOD"],
        [gstruct:id 2 ; gstruct:form "Series" ; gstruct:lemma "series" ; gstruct:pos "NNP" ; gstruct:head "3" ; gstruct:deprel "NMOD"],
        [gstruct:id 3 ; gstruct:form "800" ; gstruct:lemma "800" ; gstruct:pos "CD" ; gstruct:head "4" ; gstruct:deprel "NMOD"],
        [gstruct:id 4 ; gstruct:form "Terminator" ; gstruct:lemma "terminator" ; gstruct:pos "NNP" ; gstruct:head "5" ; gstruct:deprel "SBJ"],
        [gstruct:id 5 ; gstruct:form "is" ; gstruct:lemma "be" ; gstruct:pos "VBZ" ; gstruct:head "0" ; gstruct:deprel "ROOT"],
        [gstruct:id 6 ; gstruct:form "a" ; gstruct:lemma "a" ; gstruct:pos "DT" ; gstruct:head "7" ; gstruct:deprel "NMOD"],
        [gstruct:id 7 ; gstruct:form "type" ; gstruct:lemma "type" ; gstruct:pos "NN" ; gstruct:head "5" ; gstruct:deprel "PRD"],
        [gstruct:id 8 ; gstruct:form "of" ; gstruct:lemma "of" ; gstruct:pos "IN" ; gstruct:head "7" ; gstruct:deprel "NMOD"],
        [gstruct:id 9 ; gstruct:form "Terminator" ; gstruct:lemma "terminator" ; gstruct:pos "NN" ; gstruct:head "10" ; gstruct:deprel "NMOD"],
        [gstruct:id 10 ; gstruct:form "mass" ; gstruct:lemma "mass" ; gstruct:pos "NN" ; gstruct:head "8" ; gstruct:deprel "PMOD"],
        [gstruct:id 11 ; gstruct:form "produced" ; gstruct:lemma "produce" ; gstruct:pos "VBN" ; gstruct:head "7" ; gstruct:deprel "APPO"],
        [gstruct:id 12 ; gstruct:form "by" ; gstruct:lemma "by" ; gstruct:pos "IN" ; gstruct:head "11" ; gstruct:deprel "LGS"],
        [gstruct:id 13 ; gstruct:form "Skynet" ; gstruct:lemma "skynet" ; gstruct:pos "NNP" ; gstruct:head "12" ; gstruct:deprel "PMOD"],
        [gstruct:id 14 ; gstruct:form "." ; gstruct:lemma "." ; gstruct:pos "." ; gstruct:head "5" ; gstruct:deprel "P"];
    gstruct:predicates
        [gstruct:id 7 ; gstruct:predsense "type.01" ; gstruct:args
            [gstruct:id 7 ;  gstruct:argtype "A2"],
            [gstruct:id 8 ;  gstruct:argtype "A1"]],
        [gstruct:id 10 ; gstruct:predsense "mass.02" ; gstruct:args
            [gstruct:id 9 ;  gstruct:argtype "A1"]],
        [gstruct:id 11 ; gstruct:predsense "produce.01" ; gstruct:args
            [gstruct:id 7 ;  gstruct:argtype "A1"],
            [gstruct:id 12 ;  gstruct:argtype "A0"]].

我想使用RepositoryConnection add方法添加它,并以URL的形式添加URI和上下文。我设法弄清楚如何创建URI,但我无法弄清楚我上面提到的内容以及如何将我的URL作为资源对象的字符串。

1 个答案:

答案 0 :(得分:1)

我不确定为什么你将这个作为String,每行作为一个单独的条目,因为这是一种相当尴尬的处理方式。首先,正如约书亚所说,这些线条是相互依赖的:虽然整体可能是合法的N3语法,但每一行本身并不是合法的N3字符串。

将此数据添加到Sesame存储库的最简单方法可能是将其转换为单个String data = "@prefix gstruct: ..."; // full N3 data conn.add(new StringReader(data), "", RDFFormat.N3); ,然后按如下方式加载:

 URI context = conn.getValueFactory().createURI("http://example.org/context");
 conn.add(new StringReader(data), "", RDFFormat.N3, context);

如果要将数据添加到存储库中的特定上下文:

String

假设您实际上来自磁盘上的文件的N3数据,您可以进一步优化:不是首先创建StringReader对象然后使用File file = new File("/path/to/file.n3"); conn.add(file, "", RDFFormat.N3, context); ,而是可以输入文件对象本身:

{{1}}

暂且不说:N3语法是一种非完全标准化的格式,您可能会发现不同的解析器/编写器支持稍微不同的子集。您发布的数据看起来并不奇怪,所以您应该对此有所了解,但如果您有选择,我建议您切换到更完全标准化的不同语法格式,如Turtle或N-Triples。

Turtle语法实际上非常类似于N3(您发布的数据是有效的Turtle原样),因此切换应该需要很少甚至没有更改。