将多个RDF文档合并为一个

时间:2013-09-23 11:36:23

标签: java rdf jena

我有两份RDF文件:

  1. http://dublincore.org/2012/06/14/dcterms.rdf
  2. http://xmlns.com/foaf/spec/index.rdf
  3. 我想将它们合并到一个文件中,例如purl_foaf.rdf。我在Java工作;我怎么能和耶拿一起做这件事?

3 个答案:

答案 0 :(得分:8)

Jena有一个内置的命令行实用程序来执行此操作:rdfcat。因此,要将这两个RDF文件连接在一起并将结果作为Turtle写入文件purl_foaf.rdf,请从命令行执行以下操作。它应该在一行上,但为了便于阅读,我将其分开:

rdfcat -out Turtle "http://dublincore.org/2012/06/14/dcterms.rdf" \
   "http://xmlns.com/foaf/spec/index.rdf" > purl_foaf.rdf

答案 1 :(得分:5)

我喜欢Ian Dickinson's answer,如果我只需要这样做一次,我就会使用Jena的rdfcat。你提到你需要在Java 中执行,所以也许命令行工具不合适。使用Jena API仍然很容易。如果你只有两个模型,你可以从这两个模型中创建一个UnionModel,或者如果你有更多(可能是问题中的两个只是一个简化的案例,你实际上需要处理更多),你可以创建一个新的模型保持所有三元组,并将两个模型中的三元组添加到新模型中。这是显示每种方法的代码:

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;

import com.hp.hpl.jena.rdf.model.Model;
import com.hp.hpl.jena.rdf.model.ModelFactory;

public class ManualRDFCat {
    public static void main(String[] args) throws FileNotFoundException, IOException {
        final Model dcterms = ModelFactory.createDefaultModel().read( "http://dublincore.org/2012/06/14/dcterms.rdf" );
        final Model foafIndex = ModelFactory.createDefaultModel().read( "http://xmlns.com/foaf/spec/index.rdf" );

        // If you only have two models, you can use Union model.
        final Model union = ModelFactory.createUnion( dcterms, foafIndex );
        try ( final OutputStream out1 = new FileOutputStream( new File( "/tmp/purl_foaf1.rdf" )) ) {
            union.write( out1, "Turtle", null );
        }

        // In general, though, it's probably better to just create a new model to 
        // hold all the triples, and to add the triples to that model.
        final Model blob = ModelFactory.createDefaultModel();
        for ( final Model part : new Model[] { dcterms, foafIndex } ) {
            blob.add( part );
        }
        try ( final OutputStream out2 = new FileOutputStream( new File( "/tmp/purl_foaf2.rdf" )) ) {
            blob.write( out2, "RDF/XML-ABBREV", null );
        }
    }
}

答案 2 :(得分:3)

如果您一直在寻找像我这样的rdfcat,我已弃用rdfcat。如果您安装了Jena command line个工具,则只需使用riot即可。选项也已更改,选项的完整列表为here。从命令行进行基本合并:

riot --time --output=RDF/JSON city.rdf company.ttl country.rdf > output.js