通过SOLR索引PDF文件

时间:2011-09-27 17:03:57

标签: pdf solr

我正在使用Solrj索引SOLR的PDF文件,但有些文件无法编制索引并成为异常

GRAVE: Error: Could not parse predefined CMAP file for 'Adobe-Identity-UCS'
java.lang.NoSuchMethodError: org.apache.fontbox.cmap.CMap.lookup(II)Ljava/lang/String;
你能告诉我这是什么问题吗? 感谢

1 个答案:

答案 0 :(得分:1)

似乎与apache fontbox jar有些不匹配,提到找不到的方法。
你可以确认tika的罐子,它的所有依赖都是同步的,并且是构建的 如果使用Apache Tika项目罐解析文档正常工作,您也可以单独检查。