多个短语的{T-SQL Trigram和模糊搜索算法

时间:2015-08-20 12:55:26

标签: sql-server vb.net algorithm

虽然我在这里发现了多篇帖子和网上的文章,但没有什么能解决我遇到的问题并且正在寻找指导。

环境:VB.NET 2010 w / SQL Server 2008 R2

我的问题。 我有一个包含4列的表,每列都有一个独特的" Phrase"。多行

Col1    Col2    Col3    Col4
Phrase1 Phrase2 Phrase3 Phrase4
Phrase1 Phrase2 Phrase3 Phrase4
Phrase1 Phrase2 Phrase3 Phrase4
etc.

在应用程序中,用户可以是短语,也可以输入自己的短语。他们需要使用这个短语,搜索数据库表并显示包含最接近匹配的行。

我无法在SQL中使用CLR,并且我们没有加载MDS(在多篇文章中提到)。此外,我们没有启用全文(但"可能"允许这样做)。

我的测试: 一个例子可能是短语"打篮球"。 数据库可能会举行"与儿子一起打篮球"或"与团队一起打篮球"或者"篮球队"等等。

我曾尝试过Levenshtein计算,但它没有得到最好的成绩......它发现了#34;打壁球"作为最低分。

目前,我通过将输入的短语分成单词并执行"类似"来强制执行。并提出"匹配"。

我想找到一种方法来使这更准确(并且可能加权)。

感谢任何帮助。

0 个答案:

没有答案