我想知道SQL中是否有任何方法可以进行模糊匹配。一个数据集具有区域变量,另一个具有市场变量。理想情况下,这些应该是相同的,并且连接很容易,但我想加入两个数据集而不转换其中一个变量,因为这将是一个困难的过程。
proc sql noprint;
create table New_Map as
select a.*, b.*
from Master as a left join map as b
on a.region like b.market
;
quit;
答案 0 :(得分:0)
您可能希望查看函数COMPLEV()
,COMPGED()
或SPEDIS()
的方向。例如,您的ON
语句可以是:
on COMPGED(a.region, b.market) < [some number]
它应该取决于功能以及匹配的“模糊”程度。你必须通过实验来定义它。如果区域和市场之间只有很小的差异(一两个字母的拼写错误),这些功能可能会相当有效。