标签: string-matching n-gram
我正在尝试创建一个使用三元组进行近似字符串匹配的应用程序。现在所有记录都在数据库中,我希望能够在固定列上搜索记录。是否最好有一个额外的字段,其中包含我想要搜索的值的散列版本(如果是这样,最好的存储方式是什么?)或者是否更好地动态生成三元组?
答案 0 :(得分:1)
您使用的是哪个数据库?
PostgreSQL内置了三元函数,可以处理GiST或GiN索引。
在SQL中,我使用CLR来创建和比较trigram集,比SQL代码工作得更快,更快。