我想使用SOLR的远程流媒体工具来提取和索引文件内容。
如果我将stream.file = xxx作为参数传递给http GET方法,这可以正常工作。
但是,我有很多这些,并且想要批量处理它们(即不必每个文件都有GET)。
我有办法在SOLR中做到这一点吗?
e.g。我希望能够像这样发布一些xml:
<add>
<doc stream_file="filename">
<field name="id">123</field>
</doc>
<doc>...
答案 0 :(得分:0)
答案 1 :(得分:0)
我发现多个ADD都很快,只要你只提交批处理并且不要在每次ADD后尝试COMMIT。我猜想性能损失不值得编写自己的RequestHandler。