我需要搜索我正在使用Solr Data Import Handler的文件内容。响应应显示搜索词出现的内容行。因此,对于逐行处理,我使用的是Line Entity Processor。我的数据配置文件是
<dataConfig>
<dataSource type="BinFileDataSource" name = "fds"/>
<document>
<entity name="filelist" processor="FileListEntityProcessor" fileName="sample.docx"
rootEntity="false" baseDir="C:\SampleDocuments" >
<entity name="fileline" processor="LineEntityProcessor"
url="${filelist.fileAbsolutePath}" format="text">
<field column="linecontent" name="rawLine"/>
</entity>
</entity>
</document>
schema.xml有条目或rawLine。
<field name="rawLine" type="text" indexed="true" stored="true"/>
但是当我运行完全导入命令时,它会抛出异常 DataImportHandlerException:java.lang.ClassCastException:java.io.FileInputStream无法强制转换为java.io.Reader
请帮我解决这个问题,因为我已经花了几天时间解决这个问题。
答案 0 :(得分:0)
BinFileDataSource适用于InputStream FileDataSource 您可以尝试使用FileDataSource来检查Casting问题。
<dataSource type="FileDataSource" name = "fds"/>