SOLR POST文件没有扩展名

时间:2015-06-10 17:21:11

标签: solr solr5

我是SOLR的新手,请原谅我,如果我遗漏了一些基本的东西。

我正在使用SOLR 5,我想扫描没有扩展名的文档。不幸的是,在我的情况下,不能将文件更改为扩展名。

我正在使用的命令就是:

$bin/post -c mycore ../foldertobescaned -type application/pdf

该命令适用于具有扩展名但我得到的文档:

  

进入自动模式。考虑的文件结尾是xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log

非常感谢!

1 个答案:

答案 0 :(得分:0)

如果不能重命名文件,则可以使用以下脚本作为解决方法,直到Solr改进其post方法。它是一个简单的bash for循环,可以单独提交每个文件,无论文件扩展名如何都可以工作。请注意,此脚本将比在整个文件夹上使用post更慢,因为需要初始化每个单独的文件传输。

将下面的脚本保存为Solr文件夹中的postFolderToSolr.sh(以便Solrs bin/文件夹是一个子目录),使其可以chmod +x postFolderToSolr.sh执行,然后按如下方式使用它:{{ 1}}

不使用参数或错误数量的参数会打印一条简短的用法消息作为帮助。

./postFolderToSolr.sh mycore /home/user1/foldertobescaned/ application/pdf