我正在开发一个类似百科全书的应用程序的搜索功能,该应用程序涉及具有数百万个主题的物种。搜索信息主要是通过查找物种的通用名称或科学名称来组织的。目前我们使用Solr作为后端搜索引擎。
我正在寻找代码示例来了解用于搜索类似有组织信息的算法(不一定使用Solr)。
您是否了解开源项目以了解此类算法和搜索方法?
答案 0 :(得分:1)
好的,我只有一个半答案...一个好的起点可能是看看像Nutch或Solr或Apache Lucene这样的开源项目的来源。
如果您对开源以外的选项感兴趣,那么关于这个主题的真正非常好的教科书是“管理千兆字节”。本书通过许多不同的搜索,IR和存储算法来开发搜索引擎: