尝试使用提取将PDF添加到Solr索引时出现#500内部服务器错误

时间:2012-04-12 04:02:52

标签: solr solr-cell

我是第一个Solr用户,在Windows 7系统上使用v3.5和Tomcat 7。我在example-docs中完成了XML示例,没有任何问题。但是,我将需要使用HTML和PDF文件提取,当我尝试发布PDF文件进行索引时,我得到以下内容:

SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8080/solr/update/extract?literal.id=doc2..
SimplePostTool: POSTing file test.pdf
SimplePostTool: FATAL: Solr returned an error #500 Internal Server Error

我使用的命令是:

java -Durl=http://localhost:8080/solr/update/extract?literal.id=doc2 -Dtype=application/pdf -jar post.jar test.pdf

我的solr主目录是C:\ solr,到目前为止我已完成以下操作:

  • 复制了solr下载包的示例/ solr文件夹
  • 的内容
  • 将solr下载包的contrib / extraction / lib文件夹复制到C:\ solr \ lib
  • 将solr下载包的dist / apache-solr-cell-3.5.0.jar复制到C:\ solr \ dist \ apache-solr-cell-3.5.0.jar
  • 将C:\ solr \ conf \ solrconfig.xml中相应的“lib”标记修改为<lib dir="lib" /><lib dir="dist/" regex="apache-solr-cell-\d.*\.jar" />

我还需要做些什么来使这个工作适用于PDF和HTML文件?我已经阅读了多个教程和“入门”指南,但似乎无法理解什么是错的。我也是Tomcat的初学者,就我所知,这些都没有出现在Tomcat的日志中......所以我几乎陷入困境。同样,我对XML示例没有任何问题,因此Tomcat本身运行正常并且识别solr(我可以看到solr管理页面)。任何帮助表示赞赏。

0 个答案:

没有答案
相关问题