我有两组数据,列表A和列表B.
列表A被定义为主列表。此列表中的所有内容都必须在最终匹配中进行说明。假设它有500行数据,如DBA,地址,城市,国家等。列表B是6,000行,信息相似。
第一个问题是列表B中可能有多个匹配连接回列表A.它们都需要在最终匹配输出中捕获,包括DBA,地址,ID#等信息,因此可能在行中格式化
第二个问题是两者都可能没有明确的共同术语。地址可以用很多不同的方式拼写,而且通常是外语。与DBA,城市等相同。
第三个问题是,也无法保证列表B上列表A上的所有项目都匹配。
关于我如何处理这个问题的想法?我已经手动做了一段时间。我将参加列表A中的DBA或地址,并在列表B中执行Ctrl + F.如果有多个匹配,我将在列表A中添加一行并将列表B中的所有匹配放在那里。你可以想象,这是令人厌恶的,我希望有一种更有效的方法来做到这一点。提前感谢您的帮助!
答案 0 :(得分:0)
第一步是为每个列表创建一个公用密钥。
您可以使用“find”之类的公式来搜索地址的子字符串,并根据此创建指标列。将几个指标放在一起,可以用人名或类似的东西制作一个唯一的密钥。
在每个列表中都有一个唯一键后,您可以使用excel vlookup函数来匹配列表。