实现XML文件搜索的策略

时间:2012-06-26 15:20:55

标签: html xml

我找到了一些与搜索XML相关的帖子,但这些帖子对我的任务没有帮助。

我的任务是实施搜索。 来源:5-6个XML文件,如人物,建筑物,新闻等(每个类别都是一个XML文件,我总共有30000个条目)。 用户可以选择类别并键入一些关键字。搜索短语应搜索XML文件,并返回结果将显示在html页面上。如果用户没有选择类别,则应搜索所有XML文件。

请告诉我实施此技术和最佳技术的最佳策略/算法。

1 个答案:

答案 0 :(得分:2)

转换XML文档(使用XSL)并将它们(HTTP post)上传到Solr的实例。然后,您就可以对索引数据执行一系列搜索操作。

目前Solr Wiki不可用,但这是一个支持XML格式的示例:

<add>
  <doc>
    <field name="employeeId">05991</field>
    <field name="office">Bridgewater</field>
    <field name="skills">Perl</field>
    <field name="skills">Java</field>
  </doc>
  [<doc> ... </doc>[<doc> ... </doc>]]
</add>