我是Titan Graph数据库的新手。请让我知道我们是否可以使用Batch Graph对任何格式的文件(例如:pdf,doc,xml,xls,csv等)在titan db中执行批量加载。 如果有人知道,请回复。 提前致谢。 问候, Kamal Verma
答案 0 :(得分:3)
如果您是Titan的新手,那么您不应该看BatchGraph
数据加载,因为这是Titan 0.5.x(和TinkerPop 2.x)的概念。如果你是“新手”,你应该看看Titan 1.0(和TinkerPop 3.x):
http://s3.thinkaurelius.com/docs/titan/1.0.0/
http://tinkerpop.apache.org/docs/3.1.0-incubating/
Titan从TinkerPop获取其批量加载提示,该提示使用BulkLoaderVertexProgram
也称为BLVP
BLVP和ScriptInputFormat为您提供加载行分隔数据所需的所有灵活性(即对于csv,json,xml等,每行都是一个顶点)。这显然无法帮助您保存pdf和word文档中的数据。您必须将这些格式预先处理为行分隔格式才能以这种方式加载它们。
我强烈建议您在深入Titan之前专注于学习TinkerPop。 TinkerPop本身就是一个庞大的生态系统,并且拥有坚实的基础,因此可以了解泰坦的细微差别。我建议你先从阅读TinkerPop Getting Started Tutorial开始,然后再继续学习。
值得一提的是,如果由于某些原因你被困在Titan 0.5.x上,你可以使用BatchGraph
来加载你提到的所有数据格式,但它没有提供一种方法来本地执行。您必须编写一个脚本来解析每种格式并将其转换为将通过BatchGraph
加载的顶点/边。