应用错误收集

假设我有一个1 TB的数据文件mmapped读/写从“主”linux系统的localy挂载的hdd文件系统进入在同一“主”系统上运行的进程的虚拟地址空间。

我有20个专用的“奴隶”Linux服务器通过千兆交换机连接到“主”系统。我希望通过将其只读进入其进程地址空间，在这些“从”服务器上对此1 TB进行随机读取访问。

我的问题是，从主系统到从系统同步（可能是懒惰）数据集的最有效方法是什么？（例如，是否可以通过NFS挂载文件，然后从那里对其进行mmap？如果是，这是最佳解决方案吗？如果不是，解决方案是什么？）

我最近在工作中一直在玩这样的想法（当然，这是一个非常小的文件大小）。我相信NFS可以很好地读取，但你可能遇到并发写入的问题。如果你只有一个“作家”，那么你的想法应该合理地运作。如果数据文件是结构化的，我建议使用某种描述的分布式缓存，并允许在群集中分布数据的多个副本（用于冗余）。

最后，我们选择了SAN和集群文件系统解决方案（在我们的案例中是Symantec VCS，但任何通用的集群文件系统都可以）。我们这样做的原因是因为我们无法获得使用纯NFS所需的性能。您选择的集群文件系统需要正确支持mmap和分布式缓存。