在SOLR中远程传输多个文件

时间:2010-02-18 11:41:22

标签: streaming solr

我想使用SOLR的远程流媒体工具来提取和索引文件内容。

如果我将stream.file = xxx作为参数传递给http GET方法,这可以正常工作。

但是,我有很多这些,并且想要批量处理它们(即不必每个文件都有GET)。

我有办法在SOLR中做到这一点吗?

e.g。我希望能够像这样发布一些xml:

<add>
  <doc stream_file="filename">
    <field name="id">123</field>
  </doc>
  <doc>...

2 个答案:

答案 0 :(得分:0)

在solr-user邮件列表中

This has been recently asked(并回答)。

答案 1 :(得分:0)

我发现多个ADD都很快,只要你只提交批处理并且不要在每次ADD后尝试COMMIT。我猜想性能损失不值得编写自己的RequestHandler。