我目前正在研究加速和扩展长期运行的匹配作业的方法,该作业当前作为MSSQL 2005中的存储过程运行。匹配涉及多个字段,其中包含许多不精确的情况。虽然我想最终将其扩展到数据库之外的大规模数据集,但我还需要考虑一些短期解决方案。
鉴于我对它们如何运行的内部实现知之甚少,我想知道是否可以通过将数据集与主程序分开来将过程分解为并行程序,然后启动处理较小数据集的子程序。
使用群集数据库会产生任何性能提升吗? MSSQL会自动且合理地在集群节点上分发子进程吗?
也许最好在java中使用master进程并通过jdbc调用worker程序,这可能会有效地使用集群负载平衡?除了关于可维护性的任何争论之外,这会更快吗?
答案 0 :(得分:2)
您对SQL Server的群集意味着什么有根本的误解。群集不允许单个SQL Server实例共享多个框的资源。群集是一种高可用性解决方案,允许一个盒子的功能在发生故障时转移到另一个备用盒。