如何在索引

时间:2016-07-14 10:37:29

标签: pdf solr ms-word lucene apache-tika

我尝试使用solr-5.4.1索引许多文件msword和pdf; 在solr logg中,我只得到ERROR的描述而不是导致错误的文件;  如何获取文件列表是腐败的,Tika无法索引它们;即使solr尝试索引损坏的文件并且失败如何强制solr继续索引下一个文件,因为在solr的处理程序DIH中我在tika_data_config.xml中写道onError =“skip”或onError =“continue”不起作用因为索引停止时tika尝试索引第一个损坏的文件。

0 个答案:

没有答案