我找到了一些与搜索XML相关的帖子,但这些帖子对我的任务没有帮助。
我的任务是实施搜索。 来源:5-6个XML文件,如人物,建筑物,新闻等(每个类别都是一个XML文件,我总共有30000个条目)。 用户可以选择类别并键入一些关键字。搜索短语应搜索XML文件,并返回结果将显示在html页面上。如果用户没有选择类别,则应搜索所有XML文件。
请告诉我实施此技术和最佳技术的最佳策略/算法。
答案 0 :(得分:2)
转换XML文档(使用XSL)并将它们(HTTP post)上传到Solr的实例。然后,您就可以对索引数据执行一系列搜索操作。
目前Solr Wiki不可用,但这是一个支持XML格式的示例:
<add>
<doc>
<field name="employeeId">05991</field>
<field name="office">Bridgewater</field>
<field name="skills">Perl</field>
<field name="skills">Java</field>
</doc>
[<doc> ... </doc>[<doc> ... </doc>]]
</add>