Solr无法处理丰富的文档,但已经提取

时间:2015-12-08 16:54:31

标签: search solr data-import

最近,我正在尝试采用Solr来搜索丰富的文档文件(例如.pdf,.doc,xls ......等)

当我尝试使用Solr管理UI(localhost:18983 / solr /#/ local.info/dataimport//dataimport)从磁盘导入所有文件时,该消息始终显示"索引已完成"但没有添加/更新文件。

Data Import Messages Screenshot

我还检查了官方在线手册,以索引富文件目录(lucene.apache.org/solr/quickstart.html#indexing-a-directory-of-rich-files)。

错误消息显示

     SimplePostTool: WARNING: Solr returned an error #400 (Bad Request) for url: localhost:8983/solr/local.info/update/extract?resource.name=%2Fvar%2Fsolr%2Fdata%2Flocal.info%2Frich_documents%2FNEWS.PDF&literal.id=%2Fvar%2Fsolr%2Fdata%2Flocal.info%2Frich_documents%2FNEWS.PDF

  SimplePostTool: WARNING: Response: 
  <?xml version="1.0" encoding="UTF-8"?>
  <response>
     <lst name="responseHeader">
        <int name="status">400</int>
         <int name="QTime">71</int>
     </lst>
     <lst name="error">
        <str name="msg">
           Invalid UUID String: '/var/solr/data/local.info/rich_documents/NEWS.PDF'</str>
        <int name="code">400</int></lst>
      </response>

这是我的配置

data-config.xml,solrconfig.xml,schema.xml Configs Link

有人有想法解决这个问题吗?

由于

0 个答案:

没有答案