我有一个对象或数据包含id,name,city,pin,email,phone details。我收集了这样的大量数据。现在我想将新数据与现有的大数据进行比较,最后需要了解数据的最大匹配程度。
目前我正在迭代多个线程中的现有数据来解决这个问题,这需要花费很多时间。
*实施例: 现有数据, ID = 1,名称= A,城市= B,引脚= 1,电子邮件= C,电话= 1 ID = 2,名称= d,城市= F,销= 1,电子邮件= G,电话= 1
新数据
ID = 1,姓名= A,城市= B,销= 2,电子邮件= C,电话= 2
结果; 具有最大匹配的类似数据是第一行ID,名称,电子邮件匹配*
是否有针对此的优化企业解决方案?