我问第三次删除具有唯一人名的重复地址

时间:2014-03-05 18:20:56

标签: excel duplicates excel-formula

这是我第三次问,因为我真的需要尽快完成。我在Excel的每一行都有不同名称的重复地址。我需要清理大约17,000个条目。这是一个例子:

    Name        Address             City                    Zip
-----------------------------------------------------------------
1   Al a Moe    7009 Plainfield     Dearborn Heights MI     48127
2   Al a Adel   7009 Plainfield     Dearborn Heights MI     48127
3   Al a Amy    7009 Plainfield     Dearborn Heights MI     48127
4   Al a Ashly  7009 Plainfield     Dearborn Heights MI     48127

如何删除具有重复地址的行,而不会混淆名称和地址数据库,并且每个名称只保留一个地址?

我需要一个公式,只能将其修复为一行,一个地址和一个名称

感谢。 低音

1 个答案:

答案 0 :(得分:1)

  1. 复制您的数据。
  2. 从其中一个中删除名称列。
  3. 使用Excel删除重复项功能,每个地址只能获得一行。
  4. 添加列并查找原始数据集的副本以获取名称。如果您需要像MAX这样的特定值,请尝试类似= MAX(IF($ A $ 1:$ A $ 5 =“A1”,$ B $ 1:$ B $ 5))您可能需要创建一个连接整个列的列例如,如果多个城市/州等中存在相同的地址,则将地址放入一个字段以进行正确查找。
  5. 这应该为每行提供一个名称和一个地址,没有任何重复的地址。

    如果您可以将此数据加载到SQL数据库中,这将更加容易。

    SELECT MAX(Name), Address, City, Zip FROM Addresses
    GROUP BY Address, City, Zip
    

    针对您的数据集进行的一些修改。

    1. 我将所有地址数据转换为大写字母,因为excel比较区分大小写,而且你的一些欺骗行为相同但有个案差异。
    2. 我在执行查找时将地址列移动到第一列。
    3. 略有不同的VLOOKUP参数,因为你的名字在不同的列中,所以我不得不为每个列做一次查找。