我是分布式计算和奥尔良的新手,最近对它们进行了一些研究,不确定是否可以将奥尔良用于新任务。
此任务是,有许多项目属于不同的人,并且每个项目都有大量数据。对于每个项目,步骤如下:
- 通过计算原始数据获取新数据。原始数据存储在分布式数据库中,然后新数据将存储回数据库中。 MQ或Redis可用于提高性能。
- 根据新数据计算汇总值,然后将汇总值保存回数据库中。
我的问题是:
- 没有唯一ID的谷物。最好在所有服务器中运行多个粒度以实现负载平衡,每个粒度仅从数据库获取数据并进行计算,而无需创建具有id的实例。对于奥尔良,不允许使用无唯一ID的谷物(无状态谷物除外),而无状态谷物仅在本地运行。
- 长期运行计算。计算和摘要可能需要几秒钟或几分钟才能完成工作,是否建议使用谷物?似乎不建议在文档中使用。
- 顺序执行。有必要先根据原始数据计算新值,然后根据新值进行汇总。这意味着要汇总的谷物必须在所有要计算的谷物完成后再运行。
- 谷物从局域网中获取数据并将数据保存到数据库中,对于奥尔良是否有减少数据传输的建议?