如何在数据库中找到与输入字符串最相似的字符串

时间:2013-06-28 09:39:43

标签: php mysql database similarity

我正在从数据库中的javascript代码存储错误报告和堆栈跟踪。我想将类似的报告组合在一起但是由于浏览器和浏览器版本之间的不一致,我无法使用天真的字符串比较

我愿意使用sql或没有sql数据库,但最好使用sql,如果需要,我也可以使用弹性搜索或solr。我希望通过提交错误报告而不是cron作业来实现这一点。

至于事物的规模,很可能会有10到100个错误报告。并且很可能会有100到1000个错误报告,我需要将其归类为相同的,以减少开发人员需要处理的报告数量

1 个答案:

答案 0 :(得分:0)

我无法想象你为什么要这样做,听起来比较麻烦,然后跨浏览器测试:P

在任何情况下,如果没有数据库架构或问题中的问号,就有点难以回答。

我不会使用no-sql解决方案,而是选择一个试图索引你感兴趣拆分的东西的结构,即如果你想要所有"未定义的变量"在一个报告中,然后将包含它的任何内容放入表中并对其进行索引。这将使事情变得非常快。

我想我所说的是在存储之前对堆栈跟踪进行排序,这使报告更容易。

您还可以尝试全文搜索:http://www.petefreitag.com/item/477.cfm