我正在使用Neo4j创建一个网络数据库,其中包括:
-Taxi公司(1个节点),其中包含-cities(1000个节点),其中包含 - 出租车(100个节点/每个城市 - 总计100,000 - )。
- 每辆出租车都有一个“费用”,每天计算两次,因此每辆出租车每天有2个节点(出租车节点有一个由于这个关系属性是一个日期,因此与其费用的关系;因为当我想要检索一系列费用时,我会按日期对它们进行匹配)因此,每个城市将有两个“总费用”的总金额每个城市赚取的出租车来计算差额。
我需要这样做6个月(2个节点 - >每个出租车>> 200,000 /天 - > 360,000,000费用节点)这是很多节点和大量磁盘空间存储在硬盘驱动器上所以我的问题:
有没有办法优化这种大型数据集的磁盘存储?还是有办法压缩它?
答案 0 :(得分:2)
您可以使用Neo4j Hardware Sizing Calculator来估算存储所有这些数据所需的空间。
在这些日子里,优化磁盘空间是没有意义的,因为磁盘非常便宜。
Neo4j已经为你做了某种压缩 - http://neo4j.com/docs/stable/property-compression.html
此外,您可以使用文件系统压缩,但它会对性能产生巨大影响。