我有下表
Address, City, Data1, Data2, Data3
123 North 5th Street, San Francisco, A, B, C
123 N 5th Street, San Francisco, [Blank], D, [Blank]
123 North 5th St, San Francisco, E, F, G
我想根据2个标准合并数据:地址和城市的前4位数字 因此合并行看起来像:
123 North 5th Street, San Francisco, AE, BDF, CG
我有大约6000条记录包括“重复”。我有访问权限和excel的表格,任何帮助将不胜感激。
答案 0 :(得分:0)
你确定要对该criteia进行匹配吗?例如,您是否希望将以下记录与上述三项相匹配 旧金山北四街123号?
执行此操作的理想方法是先解决数据标准化问题,然后对其进行重复数据删除。例如,在新西兰,我们使用PAF文件(邮政地址文件)来标准化寻址并准确地向每条记录发出DPID(传递点标识符)。然后,您可以匹配数据以执行合并记录的第二步(这仍然是一项棘手的练习)。周围会有很多供应商为您在美国提供一小笔费用,Axciom我认为这是该领域的全球参与者。
如果您不想这样做,另一种选择是使用第三方工具将这些记录与某些模糊逻辑匹配而不是自己编码,我之前使用过一个名为DQGlobal的公司的Excel运行数据并匹配记录。