我负责编写存储过程,以输出两个相似的数据库之间的差异,例如,两个国家/地区的数据库分支到另一个表中的国家/地区,而另一个表中的城市又扩展到另一个表中的州。
它们之间存在一些差异,因为其中一个正在过渡到另一个,但是我需要比较主要的事物-大致列出不同之处。
说我将它们放在一起并挑选出一些关键ID字段;然后我比较这些ID的其他字段,并指定这些ID的区别,然后,对于ID不匹配的孤儿ID,将全部报告为差异。
**我的问题是我应该如何比较大型结果集?
我是否应该使用成员资格来确定状态-感觉简陋?
我应该迭代地做,只是遍历两个集合以检查是否相等-在MySQL的开销之前,这听起来是O(n ^ 2)? **
我的直觉告诉我,有一种用于执行此功能的优化工具,但是我还没有提出更多建议。
还有另一种方法吗,或者我该如何制定解决方案以使其与MySQL的工作方式完美融合?