这是一个普遍的问题,但我想知道在机器之间共享数据的一些不同方法。
基本上我有一个生成大型引用表(通常超过10gig python dict)的进程,然后其他机器运行独立的过程但引用该表。 dict一旦创建就不会改变,所有其他机器只是简单地引用它来完成他们的工作。我倾向于将所有这些存储在数据库中,然后让所有服务器查询服务器以获取该数据。我只是怀疑它可能同时有多个10gig +查询可能不是最好的方法。我想过一个平面文件或使用分发工具传递它。
有没有其他方法可以在几台机器之间共享这个python dict(一般方法很好,但我使用的是python,所以任何库建议都可以工作)?
答案 0 :(得分:0)
嗯,是的,将它存储在某种共享数据存储区中是有意义的。根据您的确切需求,您可能会发现将数据存储在某种类型的nosql类型存储中更为可取。例如redis(http://redis.io)非常合理,并且支持各种数据结构,包括哈希表。