SQL中的名字消歧

时间:2015-10-16 15:53:16

标签: sql sql-server tsql sql-server-2012

所以我已经交了一个项目,我试图找到一个前提。基本上我将从许多交易数据库中获取客户信息。然后将它们合并到一个维度表中,其中包含来自所有记录的各种有趣信息。其中一些人可能在许多数据库中,也可能多次在同一个数据库中,或两者兼而有之。

由于这个名字来自用户输入,一个条目可能会说Sally Jones,有人可能会说Susan Jones,有人可能会说S Jones,而且它们仍然是同一个人。我想到这个问题的方法是找到尽可能多的名字消歧并将其放入桥接表中,这样当我从事务数据库中提取新信息时,我可以通过桥接表运行它并匹配它做任何列出的名字

有没有人做过或听说过类似的事情?或者知道可以导入到excel / sql的表/列表,这将为我提供名字消歧的起点?

1 个答案:

答案 0 :(得分:0)

基本上,您需要一个Clients表以及一种将此表与Transactions表相关联的方法。如果DB中不存在clients表,我建议您创建它以使您的任务成为可能。为每个客户端设置一个标识并使用事务连接客户端以确切了解每个客户端的所有事务是非常重要的。