将tri-gram存储在数据库中或即时生成?

时间:2011-05-06 09:45:09

标签: string-matching n-gram

我正在尝试创建一个使用三元组进行近似字符串匹配的应用程序。现在所有记录都在数据库中,我希望能够在固定列上搜索记录。是否最好有一个额外的字段,其中包含我想要搜索的值的散列版本(如果是这样,最好的存储方式是什么?)或者是否更好地动态生成三元组?

1 个答案:

答案 0 :(得分:1)

您使用的是哪个数据库?

PostgreSQL内置了三元函数,可以处理GiST或GiN索引。

在SQL中,我使用CLR来创建和比较trigram集,比SQL代码工作得更快,更快。