Levenshtein距离与多重比较

时间:2016-01-12 20:13:24

标签: sql sql-server-2008 string-comparison levenshtein-distance

目前我正在努力创造一个最佳匹配"查询。

我遇到了this answer,但主要区别在于我有一个包含更多列的表,我需要比较6个字符串。

有没有办法用一个涉及这么多比较的查询来实现Levenshtein距离算法?我在网上看到的所有例子都涉及单一的比较排序。有没有更好的方法在涉及这么多比较的查询中获得最佳匹配?

修改

所以这是我试图查询最佳匹配的表格:

{{1}}

这是"最佳匹配"当用户提交订单请求时完成查询。他们会将数据输入相同的字段,我需要确定该用户过去是否提交过请求。

以下是三种可能的要求:

{{1}}

现在根据这三个请求,我希望Request 1成为最佳匹配。老实说,这可能是一个可怕的例子。我的观点是,除了一些拼写错误或语法错误之外,用户可能会提交几乎相同的请求。我希望在可能的情况下检索数据表中最相似的条目。

编辑2

我想知道尝试将相应的数据表列值连接成格式化字符串并将其与请求的格式化字符串进行比较是否更好。有什么想法吗?

0 个答案:

没有答案