这个问题严格与DQS性能有关。
我需要清理的'客户'表有40,000,000行......我使用子集创建了一个匹配的策略(没有问题,我只使用了前10,000个。)
现在,当我想要做一个数据质量项目......我不能把整个表放在一个项目中......它只是不会回应......我一次只设法处理40万个,即使在这种情况下也需要几乎2小时......这不是最好的解决方案,因为我需要在id为1到400,000的视图上进行项目。
对这些家伙有任何解决方案吗?
我也想知道......瓶颈在哪里?是CPU还是磁盘?
问候。