impl.ConcurrentUpdateSolrServer:状态:{file-path}为404

时间:2015-06-04 07:13:16

标签: java indexing solr solrj behemoth

我想用solr索引我的语料库。
为了创建一个序列文件,我使用了以下命令:

./behemoth -i file://path/to/my/file/where/the corpus/is/located -o /user/user-name/file-to-which-the-putput-is-stored

在此之后,我给出了以下命令用于索引:
./behemoth solr / user / user-name / pTH-to-output-is-stored-in-previous-command http://localhost:8983/solr

但它出现以下错误:

15/06/04 11:51:07 INFO mapreduce.Job: Job job_local183059797_0001 running in uber mode : false  
15/06/04 11:51:07 INFO mapreduce.Job:  map 0% reduce 0%  
15/06/04 11:51:08 INFO mapred.LocalJobRunner:   
15/06/04 11:51:08 INFO impl.ConcurrentUpdateSolrServer: Status for: file:///usr/local/ASR/data/Corpus/en_TheTelegraph_2001-2010/telegraph_2007-2010/telegraph_1st_oct_2007_to_31st_dec_2007/foreign/1071015_foreign_story_8435523.utf8 is 404  
15/06/04 11:51:08 ERROR impl.ConcurrentUpdateSolrServer: error
java.lang.Exception: Not Found  

由于上述文件存在于该路径上,我无法弄清楚该问题。请帮忙

1 个答案:

答案 0 :(得分:0)

刚刚找到您的问题,最好在DigitalPebble邮件列表上询问或在GitHub上打开一个问题。

我不认为问题与输入的内容有关。看起来更像是无法连接到SOLR。

您还导入了一组文档,但未导入任何文本或元数据作为导入的一部分。您应首先在输入上运行Tika模块。