graph - 如何通过Spark将数据加载到Titan中

如何通过Spark将数据加载到Titan中

时间：2016-05-04 06:30:41

标签： graph apache-spark titan gremlin-server

我想将数据加载到titanDB中，我知道有关批量加载和gremlin脚本会这样做，但我想使用spark做同样的事情。我有json格式的数据，我想用spark加载它。它们将火花与泰坦0.9和1.0.0中的泰坦融为一体。但是使用SparkGraphComputer我可以从泰坦读取数据，但我想与之相反，我想用火花将数据写入泰坦

参考 http://tinkerpop.apache.org/docs/3.1.0-incubating/#sparkgraphcomputer

https://groups.google.com/forum/#!topic/aureliusgraphs/DGwJnpdHPmU

1 个答案:

答案 0 :(得分：3)

您需要使用TinkerPop的BulkLoaderVertexProgram：

monkey-patching

您可以在此Titan数据迁移示例存储库中查看其工作原理的一些示例：

http://s3.thinkaurelius.com/docs/titan/1.0.0/titan-hadoop-tp3.html

以及通过CSV加载数据的示例：

https://github.com/dkuppitz/openflights

将数据加载到Titan中
如何将Postgress“Text”数据类型加载到HIVE中
如何在将数据加载到Titan时调试gremlin groovy脚本
如何通过Spark将数据加载到Titan中
有选择地将数据加载到Spark DataFrame中
我可以将数据存储到HBase中并使用Titan来加载数据
如何使用FASTLOAD通过Spark数据帧将数据加载到Teradata表中
如何将file.deflate.gz文件加载到spark数据帧中？
如何使用Spark中的Dataframe将数据加载到Product case类中
如何将HBase数据加载到Spark

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？