将多个可搜索文件添加到一个Solr-index文档中

时间:2011-10-25 16:13:00

标签: java solr solrj

是否有方法或最佳做法可以使用提取处理程序将多个文件(例如2个pdf和1个doc)添加到一个solr-index-doc中?查询时的结果看起来应该是这样的:

<result name="response">
 <str name="id">123</str>

  <doc>
   <arr name="attr_content">
    content of pdf-1
   </arr>
  </doc>

  <doc>
   <arr name="attr_content">
    content of pdf-2
   </arr>
  </doc>

  <doc>
   <arr name="attr_content">
    content of doc-1
   </arr>
  </doc>

</result>

在我的java应用程序中,我将文件添加到Solr-Index,就像只添加一个文件一样:

ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract");
up.addFile(new File("c:\\document1.pdf"));
up.setParam("literal.id", solrId);
up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);
solr.request(up);

1 个答案:

答案 0 :(得分:0)

它只允许将一个文件作为附件附加 Solr确实允许将zip文件编入索引(patch),这将索引文件的内容 因此,您可以将文件打包成zip并将其提供给Solr,它将被索引为Single文档。