Solr自定义架构问题

时间:2014-08-19 20:44:31

标签: solr

我是Solr和处理项目的新手,需要使用以下格式索引XML文档集合:

<data>
  <StoryRecord ID="12345">
    <Title>title here</Title>
    <Category>general</Category>
    <Story>Lorem ipsem .... etc</Story>
 </StoryRecord>
</data>

我的问题有两个方面:如何在架构中将<StoryRecord><Title><field name="Title" ... />之类的内容联系起来?而且,我如何使用copyField获取属性,例如StoryRecord @ ID,作为我的<field name="id" ... />? (在我将文档用作输入之前,我是否首先需要重新格式化数据?)

1 个答案:

答案 0 :(得分:0)

您将不得不以某种方式转换XML文档,因为Solr期望以特定XML格式(或JSON等 - 根据所使用的更新处理程序等)更新消息。

为仲裁XML执行此操作的最佳方法可能是使用XSLTUpdateRequestHandler,它是为将自定义XML转换为Solr的基于XML的更新格式而构建的。

默认分发版中的example/solr/collection1/conf/xslt/updateXml.xsl中有一个示例XSL。请参阅XSLTUpdateRequestHandler页面上的最后一个示例,了解如何提交XML文档以及如何指定要使用的XSL(&tr=filename.xsl)。