目前,我正在开展一项涉及大量数据清理和数据合并的项目。
我使用的数据包括帐户名称和地址信息(地址1,地址2,城市,州,邮政编码)。我一直在使用Excel模糊查找加载项来查找大于或等于90%相似度阈值的类似记录。我已准备好继续自动化我的流程,但遗憾的是,没有办法通过VBA访问加载项。
我发现了许多不同的功能(Weighted Damerlau-Levenshtein,Jaro-Winkler相似性等),但它们似乎都没有微软插件那样准确。由于加载项使用加权Jaccard相似性,我想知道是否有人找到或开发了一个功能来完成此任务?