我希望将搜索功能添加到现有的完全静态网站中。可能,新的搜索功能本身需要是动态的,因为搜索索引需要定期更新(当人们对静态内容进行更改时),并且当用户与其交互时需要动态生成搜索结果。我希望使用Python添加这个功能,因为这是我的首选语言,但我很开心。
Google Web Search API在这种情况下不起作用,因为被编入索引的内容位于专用网络上。 Django haystack不适用于这种情况,因为这需要将内容存储在Django模型中。一个名为mnoGoSearch的工具可能是一个选项,因为我认为它可以像谷歌一样蜘蛛网,但我不确定该项目的活跃程度如何;项目网站似乎有点过时了。
我很好奇使用像Solr,ElasticSearch或Whoosh这样的工具,但我相信这些工具只是索引引擎,不处理搜索内容的解析。有没有人有任何关于如何索引静态html内容以检索作为一组搜索结果的建议?感谢阅读和任何反馈。
答案 0 :(得分:1)
使用Solr,您可以编写检索要编制索引的内容的代码,从每个项目中解析出目标部分,然后将其发送给Solr进行索引。
然后,您将与Solr进行交互以进行搜索,并让它返回整个索引文档的ID或其他有关原始索引内容的识别信息,并使用该信息向用户显示结果。