使用tika索引solr中的pdf文件时出现NoSuchMethodError异常

时间:2014-02-03 12:45:12

标签: solr apache-tika

我正在尝试索引solr中的pdf文件,但我在Tika中的AutoDetectParser中得到NoSuchMethodError。我正在使用tika-parser-1.0.jar和tika-core-1.0.jar以及solrCell-3.6.0 jar。

数据的Config.xml:

<dataConfig>
     <dataSource name="bin" type="BinFileDataSource" />
     <document>
         <entity name="f" dataSource="null" rootEntity="false"
             processor="FileListEntityProcessor"
             baseDir="C:\Users\Seetha\Desktop\pdfFiles"
             fileName=".*pdf"
             onError="skip"
             recursive="true">
             <field name="doc" column="doc" />
             <field column="fileAbsolutePath" name="path" />
             <field column="fileSize" name="size" />
             <field column="fileLastModified" name="lastmodified" />
             <field column="file" name="fileName"/>

         <entity name="tika-test" dataSource="bin" processor="TikaEntityProcessor"
                      url="${f.fileAbsolutePath}" format="text" onError="skip">
             <field column="Author" name="author" meta="true"/>
             <field column="title" name="title" meta="true"/>
             <field column="text" name="content"/>
           </entity>
         </entity>
     </document>
</dataConfig>

Schema.xml的:

<field name="doc"   type="string"  indexed="true"  stored="true"  omitTf="true"     required="true"  /> 
   <field name="path" type="string" indexed="true" stored="true" />
   <field name="size" type="string" indexed="true" stored="true" />
   <field name="lastmodified" type="string" indexed="true" stored="true" />
   <field name="fileName" type="string" indexed="true" stored="true" />
   <field name="author" type="string" indexed="true" stored="true" />
   <field name="title" type="string" indexed="true" stored="true" />
   <field name="content" type="string" indexed="false" stored="true" />

请告诉我这是什么解决方案。 这是由于jar版本不匹配吗?如果有人发布链接以正确配置 solr索引pdf文件然后它会非常有帮助。 提前谢谢。

0 个答案:

没有答案