我想使用simpleposttool将一个pdf文档发布到Solr。应该使用什么命令

时间:2017-05-13 16:07:05

标签: solr lucene

对于发布XML文档,我使用了以下命令

java  -Durl=http://localhost:8983/solr/Hanu_Core/update -jar .\post.jar .\money.xml

2 个答案:

答案 0 :(得分:0)

通过查看你的头衔,我认为,你可能会要求"命令"使用SimplePostTool发布pdf。

在CLI中,您可以按以下方式键入以检查所有可用的属性和选项。

$ java -jar example/exampledocs/post.jar -h

此外,您可以按照以下示例进行操作

java -Durl=http://localhost:8983/solr/pdfs/update/extract -Dcommit=yes -Dtype=application/pdf -jar exampledocs/post.jar ~/solr-4.10.3/solr-app/solr_home/pdfs/pdfs_res/Apache_Solr.pdf

我希望这能解决你的问题。

答案 1 :(得分:0)

作为@Anis建议您可以使用-Dtype=application/pdf。也可以使用-Dauto

示例:

java -Dauto -Dc=collection_name -jar post.jar pdf_file.pdf

使用-Dauto,我们可以索引tika支持的所有文档格式。

即txt,doc,docx,pdf,xml,html等。

有关详细信息,请执行help help命令 java -jar post.jar -h