在Google Compute Engine / Amazon EC2实例上使用Neo4j的最佳做法

时间:2014-04-04 16:24:43

标签: performance amazon-ec2 neo4j disk google-compute-engine

为Neo4j优化linux机器有一个very nice guide。但本指南假定了物理硬盘的典型特征。我在Google CE和Amazon EC2上运行我的Neo4j实例。我无法找到任何详细说明这些虚拟机的最佳设置的文档。在内存(用于堆或扩展使用)和磁盘速度/ IOPS方面,我需要哪些资源才能获得最佳性能?我目前有几百万个节点和大约一千万个关系(2 GB),数据大小随着进口而增加。

在EC2上,我曾经依赖SSD暂存磁盘,然后定期备份到永久磁盘。计算引擎上没有这样的东西,写入速度对我来说似乎不是很高,至少在正常的磁盘大小(因为speed changes with size)。有没有办法在我的导入/索引操作上获得合理的性能?或者这些操作可能与内存和计算能力有关?

欢迎任何其他阅读......

1 个答案:

答案 0 :(得分:5)

尽可能使用本地磁盘,SSD优于其他磁盘,请在AWS上尝试配置操作。

EBS不合适,速度慢而且紧张。

不知道计算引擎,你可能想要使用更多的RAM,然后尝试将更大的图形部分加载到内存中。

补充阅读:http://structr.org/blog/neo4j-performance-on-ext4

你仍然应该查看该博文中提到的其他内容。像Linux调度程序一样,写入障碍等。

最好手动设置这些内存映射设置。对于二级缓存,可能会检查带有hpc缓存的企业版。

另请参阅此网络研讨会:hw-sizing

上的https://vimeo.com/46049647