SOLR Tika:将文件文本添加到现有记录(ExtractingRequestHandler)

时间:2010-07-27 20:12:18

标签: solr full-text-search apache-tika solr-cell

我正在使用“name”,“title”和“description”字段索引SOLR中的帖子。我希望以后能够使用Tika / ExtractingRequestHandler添加文件(如Word文档或PDF)。

我知道我可以像这样添加文件:(或通过其他界面)

  

卷曲   'http://localhost:8983/solr/update/extract?literal.id= POST1 &安培;提交=真'   -F“myfile=@tutorial.html”

但这取代了正确的帖子(上面的post1) - 是否有一个参数我可以传递给它只添加到记录中?

1 个答案:

答案 0 :(得分:6)

在Solr(ver< 4.0)中,您无法修改文档中的字段。您只能删除或添加/替换整个文档。因此,在将文件“追加”到Solr文档时,您必须从其当前值(使用literal)重建文档,即查询文档,然后:

http://localhost:8983/solr/update/extract?literal.id=post1&literal.name=myName&literal.title=myTitle&literal.description=myDescription&commit=true