任何数据源的批量加载的Titan图数据库问题

时间:2015-12-14 10:44:09

标签: database graph titan

我是Titan Graph数据库的新手。请让我知道我们是否可以使用Batch Graph对任何格式的文件(例如:pdf,doc,xml,xls,csv等)在titan db中执行批量加载。 如果有人知道,请回复。 提前致谢。 问候, Kamal Verma

1 个答案:

答案 0 :(得分:3)

如果您是Titan的新手,那么您不应该看BatchGraph数据加载,因为这是Titan 0.5.x(和TinkerPop 2.x)的概念。如果你是“新手”,你应该看看Titan 1.0(和TinkerPop 3.x):

http://s3.thinkaurelius.com/docs/titan/1.0.0/

http://tinkerpop.apache.org/docs/3.1.0-incubating/

Titan从TinkerPop获取其批量加载提示,该提示使用BulkLoaderVertexProgram也称为BLVP

BLVP和ScriptInputFormat为您提供加载行分隔数据所需的所有灵活性(即对于csv,json,xml等,每行都是一个顶点)。这显然无法帮助您保存pdf和word文档中的数据。您必须将这些格式预先处理为行分隔格式才能以这种方式加载它们。

我强烈建议您在深入Titan之前专注于学习TinkerPop。 TinkerPop本身就是一个庞大的生态系统,并且拥有坚实的基础,因此可以了解泰坦的细微差别。我建议你先从阅读TinkerPop Getting Started Tutorial开始,然后再继续学习。

值得一提的是,如果由于某些原因你被困在Titan 0.5.x上,你可以使用BatchGraph来加载你提到的所有数据格式,但它没有提供一种方法来本地执行。您必须编写一个脚本来解析每种格式并将其转换为将通过BatchGraph加载的顶点/边。