我需要为我的项目实现搜索功能。在探索一些全文搜索引擎之后。我发现适合我的项目的sphinx搜索。
经过一番了解后我发现需要将数据提供给数据库,然后索引器从Db中提取数据并构建索引。之后,searchd使用该索引来回答查询。很难在我的Ubuntu中安装它机器,我不知道如何继续。我没有找到任何样本项目要查看。我有搜索用户提供的关键字的html文件列表。
我的第一个问题是
1)任何完整的狮身人面像搜索指南?
2)如何将html文件插入Db.spsix支持搜索html文件?
3)我的项目完全只用javascript完成。截至目前没有服务器端。要集成 这个搜索功能进入我的项目。我是否需要使用任何API与主代码进行通信?
很抱歉这么久,问了太多问题。一个初学者程序员并弄清楚所有这些看起来很难。
任何人都能帮我解决这个问题吗?
提前致谢。
答案 0 :(得分:0)
不是真的。因为它永远无法涵盖所有要点。该手册有一个很好的安装指南,否则在线阅读教程。
您无需将它们插入数据库。 Sphinx可以为其他来源编制索引。特别是TSV或XML文件。甚至是一个只输出XML用于索引的脚本(因此它读取文件,并输出Sphinx索引的新XML)或者你可以只将文件名插入数据库,sphinx可以从文件本身获取内容。
或者可以使用实时索引,您可以将数据直接“插入”sphinx索引,不需要中间数据库/文件等
是的,狮身人面像可以直接索引html内容 - 它可以剥离原始HTML,只留下文本索引strip_html
是的,狮身人面像需要在服务器上运行。
如果您的数据适中(几MB),可以只在客户端上编制索引 - 客户端必须下载的索引很小。 https://github.com/reyesr/fullproof
也可以使用http://indexden.com/之类的东西来提供'sphinx作为服务':)