使用Lucene,NoSuchFieldError索引PDF

时间:2013-07-24 18:50:41

标签: pdf lucene nosuchfieldexception

我正在尝试使用Apache Lucene 4.4索引PDF文件

我一直收到以下异常:

Exception in thread "main" java.lang.NoSuchFieldError: TOKENIZED
at com.snowtide.pdf.lucene.LuceneInterface20.addField(SourceFile:18)
at com.snowtide.pdf.lucene.PDFDocumentFactory.buildPDFDocument(SourceFile:174)
at com.snowtide.pdf.lucene.PDFDocumentFactory.buildPDFDocument(SourceFile:84)
at com.apache.lucene.search.EasyLuceneIntegration.addPDFToIndex(EasyLuceneIntegration.java:134)
at com.apache.lucene.search.EasyLuceneIntegration.main(EasyLuceneIntegration.java:62)

我正在使用PDFTextStream并在此处跟随他们的示例: enter link description here

1 个答案:

答案 0 :(得分:1)

您引用的项目仅支持Lucene 2.2。我建议您查看,以便将PDF格式化为可接受的格式,或者您可以使用(我相信,这是Tika用于PDF的软件包)。