Solr和自定义更新处理程序

时间:2011-07-06 09:00:15

标签: plugins solr handler

我有一个关于Solr的问题以及实现自定义更新处理程序的可能性

基本上,情况如下:

  • FIELD-A:我的主要领域
  • FIELD-B和FIELD-C:在A
  • 中具有源的2个复制域

在FIELD-A存储了它的值之后,我需要将这个值复制到FIELD-B和C中,然后处理(比如提取一个子串)并在索引时间之前存储在FIELD-B和C中。我没有使用DIH。

编辑:我正在通过荷兰推送我的数据(忘记提及)

据我所知,复制域在索引后触发(但我对此不太确定)。

我已经通过the wiki page阅读了,但我仍然不了解很多事情:

1)customupdateprocessor是conditionalcopyfield的替代方法,还是必须存在于我的solr中?

2)创建我的conditionalcopyfield jar文件后,如何在我的模式中声明它?

3)如何修改solrconfig.xml以使用我的更新程序?

4)如果我选择了错误的方式,任何建议都会受到赞赏,如果提供了一些示例或记录良好的链接,那就更好了

我读了很多(谷歌搜索和lucene ml),但没有太多关于此的文档。我只需要为我的两个copyfields创建一个自定义更新程序,

提前全部谢谢!

2 个答案:

答案 0 :(得分:3)

它并不复杂..以下是我编写自定义solr更新处理程序的一个很好的链接。

  http://knackforge.com/blog/selvam/integrating-solr-and-mahout-classifier

我在我的solr中进行了测试,它运行正常!

答案 1 :(得分:0)

如果您正在使用SOLR 4或计划使用它,http://wiki.apache.org/solr/ScriptUpdateProcessor可能是一个更简单的解决方案。玩得开心!