如何将数据从任何文件格式导入JanusGraph

时间:2017-12-21 16:51:17

标签: janusgraph

我想将一些数据导入JanusGraph。

我从JanusGraph download获得了最新版本。我打开了Gremlin控制台,并从入门教程初始化了默认连接。

gremlin> graph = JanusGraphFactory.open('conf/janusgraph-berkeleyje-es.properties')

到目前为止,这么好。我创建了一个顶点,一个边和一个索引。所以,现在我可以在控制台中做一些基础知识。

现在我想导入一些数据用于测试目的。我不关心文件格式和数据格式。我可以准备文件。

问题在于我找不到如何在JanusGraph中导入数据文件的好例子。

任何人都可以帮助分步说明吗?

1 个答案:

答案 0 :(得分:5)

Apache TinkerPop“入门”教程介绍了如何加载CSV数据:

http://tinkerpop.apache.org/docs/current/tutorials/getting-started/#_loading_data

基本过程只需编写Groovy脚本并在Gremlin控制台中执行它。脚本需要使用您选择的解析库以您选择的格式(CSV,JSON,XML等)简单地读取数据。对于CSV,您可以采用仅使用标准Groovy类的教程中演示的简单方法,但对于更复杂的CSV文件,您可以使用类似groovycsv的库。这里的要点是,一旦您读取了要加载的数据,就可以将其写入您在上面的代码中实例化的Graph实例。你可以用Gremlin addV()addE()方法做到这一点。

请注意,像这样开发加载脚本通常意味着“较小”的数据量。如果您需要加载具有数十亿边缘的图形,这样的方法将花费很长时间。对于这种情况,您可能希望以某种方式并行加载数据(例如BulkLoaderVertexProgram