我是Solr的新手,但我认为有一种简单的方法可以使用Solr索引SVG文件。我已经安装了Solr 6.3.0并且我使用了一个示例'files'核心。它运行良好,但似乎它将SVG文件解析为纯文本。
是否有一种简单的方法可以只采用文本标记之间的文字?
理想情况下,我想将来自JSON文件的一些元数据与来自SVG文件的文本组合在一起。 JSON文件如下所示:
{ "id":"000001", "title":"Some diagram", ... } ...
关联的svg文件是000001.svg。
有没有办法在Solr中创建一个方案,可以从json中获取字段并将字段与SVG文件中的文本合并?
答案 0 :(得分:0)
最灵活的方法就是编写一个自定义索引实用程序来解析你的JSON,获取SVG并提取相关元素,然后将完整的结构提交给Solr。根据您选择的编程语言,您可以使用SolrJ,Solrnet或其他客户端库来执行此操作。
这比直接将其集成到Solr中更灵活和可维护,但是如果要进行自定义SVG索引(没有额外的JSON),可以在常规更新处理程序中使用XSLT support,或者使用DataImportHandler配置中的an XPathEntityProcessor。
我的选择是自定义索引代码。