我遇到了使搜索输出对最终用户更实用的问题。问题与算法和方法有关,然后与确切的技术或框架有关。
目前我们有一个产品数据库,可以用以下模式描述:
从搜索的角度来看,我们已经完成了非常标准的事情,使用令牌分析器进行第三方文本搜索,处理错误类型和同义词(它不是完整列表,但正如我所说,它超出了范围)。但是我们需要执行额外的工作来使搜索结果更接近现实生活中的用户需求,可能与谷歌按相关性对索引页面进行排序的方式类似。想法,我们已经认为可能适用于解决问题:
感谢任何帮助或建议方向,在哪里挖掘。
答案 0 :(得分:1)
您可以尝试pLSA;网上有很多参考文献,应该有图书馆和源代码。
编辑:
好吧,我最近仔细看了一下Lucene,它似乎给出了一个更好的答案,实际问题是什么(它没有使用pLSA)。至于与db的集成,你可以使用Hibernate Search(虽然它看起来不像使用Lucene directy那样强大)。