检查重复数据

时间:2014-03-14 03:39:31

标签: mysql sql ms-access duplicate-removal

我在Access DB中开发了一个相当原始的表。表结构看起来像这样(列名):

  • Id(UNSIGNED INT)
  • 名字(VARCHAR 255)
  • 姓氏(VARCHAR 255)
  • 地址(TEXT)
  • 等...

它包含> 1000条记录。我确信数据存在重复。例如:

  1. 有两个记录指的是同一个人,即使名称不同。
  2. 有一条记录可能会说John Doe,而其他人可能会说john Doe(注意大写)。

    我正在尝试从Access DB迁移到MySQL DB(这很容易),我想知道的是,一旦我成功将其迁移到MySQL,删除所有重复项(名称)的最佳方法是什么。 / p>

    我也不在乎是否有多个记录具有相同的地址。我只想确保同一个人有两个或两个以上的名字。

    我应该:

    • 通过脚本进行迁移吗? (例如写一个脚本来检查,在插入之前)
    • 首先迁移到MySQL,然后再进行检查(可以使用MySQL完成此检查吗?)
    • 首先迁移到MySQL,然后通过脚本进行检查。

0 个答案:

没有答案