我正在使用一个庞大的数据库,每天都会更新新数据库。为了找到重复项,我们使用其中之一 校验和使用hashbytes函数然后自定义删除重复项功能,或仅使用合并功能导入唯一条目。但是我们遇到了 当一组条目被认为是唯一的商业信息时会遇到一些困难。
E.g:
date name adress
2013-07-01 peter ad1
2013-07-01 peter ad2
2013-07-01 peter ad3
2013-07-02 peter ad1
2013-07-02 peter ad2
2013-07-02 peter ad3
2013-07-04 peter ad1
2013-07-04 peter ad3
2013-07-05 peter ad1
2013-07-05 peter ad2
2013-07-05 peter ad3
期望的结果是
date name adress
2013-07-01 peter ad1
2013-07-01 peter ad2
2013-07-01 peter ad3
2013-07-04 peter ad1
2013-07-04 peter ad3
2013-07-05 peter ad1
2013-07-05 peter ad2
2013-07-05 peter ad3
这是一个简化的案例,一般来说导入函数应该能够考虑几个属性的组合 用于识别唯一的行集。