我正在尝试通过利用owl / RDF格式使用Spark(GraphX)构建基于图形的uniprot数据视图。我试图使用apache jena解析数据,但我无法绕过rdf文件的结构。为了更好地说明,这是我正在尝试处理的文件类型的示例。 http://pastebin.com/iSeGs0RZ
根据我的需要,我必须存储/操作例如
我需要保存令牌“seeAlso”和?谓词? “http://purl.uniprot.org/string/9606.ENSP00000418960”
尝试在java / scala打印(模型)中加载模型时显示大部分信息,但我找不到从文件中提取所有内容的方法。
这是我在模型中使用的内容: 对象跑者{ val inputFileName =“dataset / test2.xml”
def main(args: Array[String]) {
val model = ModelFactory.createDefaultModel()
// use the FileManager to find the input file
val in = FileManager.get().open(inputFileName)
if (in == null) {
throw new IllegalArgumentException(
"File: " + inputFileName + " not found")
}
model.read(in, "RDF/XML")
val items = model.listObjects()
var count = 0
while (items.hasNext) {
count += 1
val node = items.next()
println(node)
println("\n\n")
}
println(count)
}
}