目前我们有一个批处理驱动的流程,每15分钟运行一次,每次运行时都会多次重复此循环:
它无法一次性加载所有数据,因为数据被多个字段隔离,并且每组数据在处理期间需要不同的行为(可从前端配置)。 然而,最近业务的变化导致一些组的数据量突然激增(因此需要处理时间),所以现在只要其中一个组超出它就会延迟所有其他组。
我们的计划是在多台计算机上并行处理此流程,以便:
我已经对分布式环境的主从模式做了一些研究,但到目前为止还没有找到很多参考资料,这里有没有人知道这种模式的良好实现?关于这种架构的潜在缺陷的任何指示也将非常受欢迎!
谢谢,
答案 0 :(得分:0)
上面的主/从设计似乎意味着无论如何都会对数据库的写入进行序列化,因此您是否考虑过并行运行当前进程的多个副本(例如,通过为每个作业分配新进程)和管理通过共享应用程序锁争用?