如何在Windows上的solr上安装Rich Document补丁?

时间:2012-07-17 19:44:34

标签: tomcat solr lucene

文档说要查看此页面:http://wiki.apache.org/solr/HowToContribute#Working_With_Patches

但它没有太大帮助。

我已经下载了rich.patch(http://wiki.apache.org/solr/UpdateRichDocuments#Updating_a_Solr_Index_with_Rich_Documents_such_as_PDF_and_MS_Office),我已经进入了我的solr主目录。我试图运行以下命令:

patch -p0 -i rich.patch

它只是问我要修补哪个文件。例如,它会说:

can't find file to patch at input line 2681
Perhaps you used the wrong -p or --strip option?
The text leading up to this was:

Index: example/solr/conf/solrconfig.xml

当它提示我的时候,对于我想修补的文件,我只输入了我的solrconfig.xml文件的路径,“C:\ xampp \ solr \ conf \ solrconfig.xml”

当我这样做时,它成功更新了我的java / org文件夹以包含ExcelParse.java,PowerPointParser.java等。但是当我尝试使用“java -jar post.jar <。发布word文档时。” / em>“,我收到了错误

FATAL: Solr returned an error #400 Bad Request

1 个答案:

答案 0 :(得分:0)

使用Solr 1.4版本修复了rich.patch,您应该可以使用Solr解析和索引Rich文档,而无需任何补丁。

正如毛里西奥提到的,请查看ExtractingRequestHandler

同时退房: -

posting-rich-documents-to-apache-solr-using-solrj-and-solr-cell-apache-tika
indexing-rich-files-into-solr-quickly-and-easily