我正在尝试索引solr中的pdf文件,但我在Tika中的AutoDetectParser中得到NoSuchMethodError。我正在使用tika-parser-1.0.jar和tika-core-1.0.jar以及solrCell-3.6.0 jar。
数据的Config.xml:
<dataConfig>
<dataSource name="bin" type="BinFileDataSource" />
<document>
<entity name="f" dataSource="null" rootEntity="false"
processor="FileListEntityProcessor"
baseDir="C:\Users\Seetha\Desktop\pdfFiles"
fileName=".*pdf"
onError="skip"
recursive="true">
<field name="doc" column="doc" />
<field column="fileAbsolutePath" name="path" />
<field column="fileSize" name="size" />
<field column="fileLastModified" name="lastmodified" />
<field column="file" name="fileName"/>
<entity name="tika-test" dataSource="bin" processor="TikaEntityProcessor"
url="${f.fileAbsolutePath}" format="text" onError="skip">
<field column="Author" name="author" meta="true"/>
<field column="title" name="title" meta="true"/>
<field column="text" name="content"/>
</entity>
</entity>
</document>
</dataConfig>
Schema.xml的:
<field name="doc" type="string" indexed="true" stored="true" omitTf="true" required="true" />
<field name="path" type="string" indexed="true" stored="true" />
<field name="size" type="string" indexed="true" stored="true" />
<field name="lastmodified" type="string" indexed="true" stored="true" />
<field name="fileName" type="string" indexed="true" stored="true" />
<field name="author" type="string" indexed="true" stored="true" />
<field name="title" type="string" indexed="true" stored="true" />
<field name="content" type="string" indexed="false" stored="true" />
请告诉我这是什么解决方案。 这是由于jar版本不匹配吗?如果有人发布链接以正确配置 solr索引pdf文件然后它会非常有帮助。 提前谢谢。