通过solr模式文件进行数据转换

时间:2012-08-09 08:07:33

标签: solr

我想知道使用solr架构文件是否可以实现以下目的?

我导入的多值字段包含

等数据
  • 产品
  • 产品/计算机
  • 产品/计算机/笔记本
  • 产品/计算机/笔记本电脑/网络摄像头

现在,我想要做的是在导入示例时为每个值的开头添加一个值,例如深度指示器....

  • C0 /产品
  • C1 /产品/计算机
  • C2 /产品/计算机/笔记本
  • C3 /产品/计算机/笔记本电脑/网络摄像头

任何人都知道这是可能的还是我最好在导入之前在我的数据源上进行转换?

在此先感谢任何帮助或指示将不胜感激:)

2 个答案:

答案 0 :(得分:1)

我猜你可以用ScriptTransformer来实现,通过计算分隔符的数量(/)并将CNumber预先加到值上。

但是如果你正在预处理数据以对其进行索引,那么我会在那里做到这一点,如果你避免使用ScriptTransformer索引会更快并且你会有更少的麻烦。

答案 1 :(得分:0)

如果您使用Solr 4,则另一种方法是在执行标记化之前使用ScriptUpdateProcessor来修改数据。 http://wiki.apache.org/solr/ScriptUpdateProcessor

使用ScriptUpdateProcessor,您不必编写Java,可以使用JavaScript或其他脚本语言,如Python或Ruby。