我在Ubuntu服务器上集成solr时遇到了问题。在ubuntu服务器上使用solr之前我在我的mac上测试它它工作得很好。它索引了我的PDF,Doc,Docx文档。所以在ubuntu服务器上安装solr并使用相同的配置文件和库。我发现solr没有索引PDf文件。但我可以搜索.Doc和.Docx文件。
这里是我的solrconfig.xml内容的一些部分:
<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-cell-\d.*\.jar" />
<requestHandler name="/update/extract"
startup="lazy"
class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="lowernames">true</str>
<str name="fmap.meta">ignored_</str>
<str name="fmap.content">_text_</str>
</lst>
</requestHandler>
提前致谢。