我是Solr和处理项目的新手,需要使用以下格式索引XML文档集合:
<data>
<StoryRecord ID="12345">
<Title>title here</Title>
<Category>general</Category>
<Story>Lorem ipsem .... etc</Story>
</StoryRecord>
</data>
我的问题有两个方面:如何在架构中将<StoryRecord><Title>
与<field name="Title" ... />
之类的内容联系起来?而且,我如何使用copyField获取属性,例如StoryRecord @ ID,作为我的<field name="id" ... />
? (在我将文档用作输入之前,我是否首先需要重新格式化数据?)
答案 0 :(得分:0)
您将不得不以某种方式转换XML文档,因为Solr期望以特定XML格式(或JSON等 - 根据所使用的更新处理程序等)更新消息。
为仲裁XML执行此操作的最佳方法可能是使用XSLTUpdateRequestHandler,它是为将自定义XML转换为Solr的基于XML的更新格式而构建的。
默认分发版中的example/solr/collection1/conf/xslt/updateXml.xsl
中有一个示例XSL。请参阅XSLTUpdateRequestHandler页面上的最后一个示例,了解如何提交XML文档以及如何指定要使用的XSL(&tr=filename.xsl
)。