Solr定制变压器

时间:2014-09-12 16:16:47

标签: java solr indexing

我是solr的新手,直到现在我只使用它来索引来自DB的数据。现在我正在尝试编写一个自定义的Transformer。我已经在http://wiki.apache.org/solr/DIHCustomTransformer阅读了文档,但我无法弄清楚如何将其配置为从DIH中可见。

我的目的是索引上传的图像数据。某些信息来自数据库,例如图像的所有者或存储文件的路径。从图像文件中提取其他信息,主要是元数据。我的想法是设置一个从db中提取数据的dataInputHandler,以及一个提取元数据并将其放入solr文档的Transformer。

有人可以解释一下自定义变压器的工作原理吗?

提前感谢您的帮助

1 个答案:

答案 0 :(得分:0)

该类必须在Solr可见的类路径上可用,通常通过其中一个配置的lib目录中提供的.jar文件(或者您可以将自己的文件添加到solr配置文件中(solrconfig) .xml - 任何路径都与<lib>条目中的此文件相关。。有关Solr如何找到您的插件代码的详细信息,请参阅How to Load Plugins

然后,您的变换器将从DB接收整行,您可以在其中读取文件路径并将新列添加到返回DIH导入器的行中以包含在文档中。