我是第一个Solr用户,在Windows 7系统上使用v3.5和Tomcat 7。我在example-docs中完成了XML示例,没有任何问题。但是,我将需要使用HTML和PDF文件提取,当我尝试发布PDF文件进行索引时,我得到以下内容:
SimplePostTool: version 1.4
SimplePostTool: POSTing files to http://localhost:8080/solr/update/extract?literal.id=doc2..
SimplePostTool: POSTing file test.pdf
SimplePostTool: FATAL: Solr returned an error #500 Internal Server Error
我使用的命令是:
java -Durl=http://localhost:8080/solr/update/extract?literal.id=doc2 -Dtype=application/pdf -jar post.jar test.pdf
我的solr主目录是C:\ solr,到目前为止我已完成以下操作:
<lib dir="lib" />
和<lib dir="dist/" regex="apache-solr-cell-\d.*\.jar" />
我还需要做些什么来使这个工作适用于PDF和HTML文件?我已经阅读了多个教程和“入门”指南,但似乎无法理解什么是错的。我也是Tomcat的初学者,就我所知,这些都没有出现在Tomcat的日志中......所以我几乎陷入困境。同样,我对XML示例没有任何问题,因此Tomcat本身运行正常并且识别solr(我可以看到solr管理页面)。任何帮助表示赞赏。