我正在使用OrientDB开发POC。我已经在3台服务器上进行了设置。我阅读了OrientDB文档,并希望如此 知道以CSV文件形式加载数据的最佳方法。具有3个类顶点和3个类边的模式应该是 相互联系。
以下是我的一些问题:
1)如果我为每个类创建3个集群并将每个集群分配给其中一个服务器,那么它在ETL性能方面是否有意义? (基于这个链接:http://orientdb.com/docs/2.2.x/Distributed-Sharding.html我不担心现阶段的容错能力)
2)关于ETL存储过程,我正在考虑3个选项:
利用OGraphBatchInsert
以文件形式存储( http://orientdb.com/docs/2.2.x/Graph-Batch-Insert.html)
对于第二种和第三种方法,我需要手动提供记录ID,我的疑问是如何确保不创建重复顶点。索引会帮助避免这种情况吗? 上述3种方法在性能方面有何比较?
3)是否可以使用ETL工具中的“plocal”选项将OrientDB集群的一台服务器存储在该机器中?
4)即使OrientDB在分布式模式下运行,是否可以对ETL使用plocal选项?
答案 0 :(得分:0)