从rdf模型中将本体读入GraphX

时间:2015-12-22 11:52:33

标签: java scala rdf jena owl

我正在尝试通过利用owl / RDF格式使用Spark(GraphX)构建基于图形的uniprot数据视图。我试图使用apache jena解析数据,但我无法绕过rdf文件的结构。为了更好地说明,这是我正在尝试处理的文件类型的示例。 http://pastebin.com/iSeGs0RZ

根据我的需要,我必须存储/操作例如
     我需要保存令牌“seeAlso”和?谓词? “http://purl.uniprot.org/string/9606.ENSP00000418960” 尝试在java / scala打印(模型)中加载模型时显示大部分信息,但我找不到从文件中提取所有内容的方法。

这是我在模型中使用的内容:     对象跑者{       val inputFileName =“dataset / test2.xml”

  def main(args: Array[String]) {
    val model = ModelFactory.createDefaultModel()

    // use the FileManager to find the input file
    val in = FileManager.get().open(inputFileName)
    if (in == null) {
      throw new IllegalArgumentException(
        "File: " + inputFileName + " not found")
    }
    model.read(in, "RDF/XML")
    val items = model.listObjects()
    var count = 0
    while (items.hasNext) {
      count += 1
      val node = items.next()
      println(node)
      println("\n\n")
    }
    println(count)
  }
}

0 个答案:

没有答案