Teradata SQL基于近似字符串匹配提取记录

时间:2016-07-06 23:18:44

标签: teradata levenshtein-distance fuzzy metaphone

我们的版本是TD 14,我来自Netezza / Postgre(Redshift)背景。我被要求从审计日志中提取登录数据,以找出同一个ip提交类似外观用户名且记录变化较小的记录/事务。例如Samir - > Samr - >阿米尔等 捕获网络钓鱼活动。 在POstgres中,我们有模糊的字符串函数,如'%',例如ColA%ColB(其中%运算符等效于类似) Soundex,Metaphone,levenshtein等 然而,在Teradata,我刚刚遇到或者我已经能够找到Soundex。是否有使用Teradata版本14的内置函数/方法功能来实现上述字符串近似。

1 个答案:

答案 0 :(得分:0)

Teradata 14.x通过EDITDISTANCE()函数支持Damerau-Levenshtein距离算法,并通过NGRAM()函数匹配n-gram模式。

您可以找到有关EDITDISTANCE函数here和NGRAM()函数here的信息。