使用solr行实体处理器读取文件内容时获取异常

时间:2013-09-09 22:14:11

标签: solr

我需要搜索我正在使用Solr Data Import Handler的文件内容。响应应显示搜索词出现的内容行。因此,对于逐行处理,我使用的是Line Entity Processor。我的数据配置文件是

<dataConfig>
<dataSource type="BinFileDataSource" name = "fds"/>
<document>
<entity name="filelist" processor="FileListEntityProcessor" fileName="sample.docx"
          rootEntity="false"   baseDir="C:\SampleDocuments" >
        <entity name="fileline" processor="LineEntityProcessor"
                url="${filelist.fileAbsolutePath}" format="text">                   
                <field column="linecontent" name="rawLine"/>
        </entity>
</entity>
</document>

schema.xml有条目或rawLine。

<field name="rawLine"  type="text" indexed="true" stored="true"/>

但是当我运行完全导入命令时,它会抛出异常 DataImportHandlerException:java.lang.ClassCastException:java.io.FileInputStream无法强制转换为java.io.Reader

请帮我解决这个问题,因为我已经花了几天时间解决这个问题。

1 个答案:

答案 0 :(得分:0)

BinFileDataSource适用于InputStream FileDataSource 您可以尝试使用FileDataSource来检查Casting问题。

<dataSource type="FileDataSource" name = "fds"/>