我正在尝试将包含PDF BLOB的MS SQL字段导入SOLR并收到以下错误:
处理时出现异常:附件文件: SolrInputDocument(字段: []):org.apache.solr.handler.dataimport.DataImportHandlerException: java.lang.RuntimeException:不支持的类型:class java.lang.String 在 org.apache.solr.handler.dataimport.DataImportHandlerException.wrapAndThrow(DataImportHandlerException.java:63) 在 org.apache.solr.handler.dataimport.EntityProcessorWrapper.nextRow(EntityProcessorWrapper.java:246) 在 org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:476) 在 org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:415) 在 org.apache.solr.handler.dataimport.DocBuilder.doFullDump(DocBuilder.java:330) 在 org.apache.solr.handler.dataimport.DocBuilder.execute(DocBuilder.java:232) 在 org.apache.solr.handler.dataimport.DataImporter.doFullImport(DataImporter.java:416) 在 org.apache.solr.handler.dataimport.DataImporter.runCmd(DataImporter.java:480) 在 org.apache.solr.handler.dataimport.DataImporter $ 1.run(DataImporter.java:461) 引起:java.lang.RuntimeException:不支持的类型:class java.lang.String中
以下是我的dataimport文件的相关部分:
<entity
name="attachment"
dataSource="dastream"
processor="TikaEntityProcessor"
dataField="items.CONTENTDATAFILE"
format="text"
<field column="content" name="body" />
</entity>
任何人都知道什么是错的? SOLR版本是4.10.3
答案 0 :(得分:2)
对于有问题的实体,字段 CONTENTDATAFILE 可能为空...