solr索引PDF附件不起作用。在ubuntu

时间:2016-01-23 10:24:30

标签: ubuntu pdf indexing solr lucene

我在Ubuntu服务器上集成solr时遇到了问题。在ubuntu服务器上使用solr之前我在我的mac上测试它它工作得很好。它索引了我的PDF,Doc,Docx文档。所以在ubuntu服务器上安装solr并使用相同的配置文件和库。我发现solr没有索引PDf文件。但我可以搜索.Doc和.Docx文件。
这里是我的solrconfig.xml内容的一些部分:

<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
  <lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-cell-\d.*\.jar" />

<requestHandler name="/update/extract"
                  startup="lazy"
                  class="solr.extraction.ExtractingRequestHandler" >
    <lst name="defaults">
      <str name="lowernames">true</str>
      <str name="fmap.meta">ignored_</str>
      <str name="fmap.content">_text_</str>
    </lst>
  </requestHandler>

提前致谢。

0 个答案:

没有答案