我试图比较两个系统的两个数据集(供应商主数据)。我们正在转向一个系统,因此我们希望避免重复。问题是名称,地址等可能略有不同。例如,该名称可能以' Inc'或者'公司'或者地址可能是' St'或者' Street'。供应商的主人已被倾销到excel,所以我正在考虑将他们拉进去比较他们,但我不知道如何处理不精确的比赛。我需要比较的数据字段是:姓名,地址,电话号码,feder税号(如果已填充),联系人姓名
答案 0 :(得分:1)
以下是我的进展方式。你很少会在Stack Exchange上得到这样的答案,因为你的问题如果不够集中。这是一组非常通用的步骤,并非特定于特定工具(即数据库或电子表格)。正如我在评论中所说,您需要搜索有关您使用的特定工具的具体答案(或询问新答案)。在不知道所有细节的情况下,Access在进行一些初步匹配时肯定是有用的,但您也可以直接使用Excel,甚至可以使用Oracle SQL,因为您将它作为资源。
一旦匹配的字段被充分擦洗,现在匹配不同的字段。
你从未说过你有多少记录。如果可能,您的组织可能值得手动验证自动匹配,并将其并排列出并在需要时手动调整它们。
但即使您成功配对非完全匹配,仍有人需要决定为合并系统保留哪条记录。我想你可能在公司名称和税号上有匹配 - 基本上是验证匹配 - 但仍然有不同的地址和/或联系人姓名。没有技术答案可以帮助您了解要保留或丢弃的数据。再次,应该进行人工审查以最终确定合并的记录。如果你正确设置它,一对人眼球可能会在一天之内完成数千条记录。