我是SOLR的新手,请原谅我,如果我遗漏了一些基本的东西。
我正在使用SOLR 5,我想扫描没有扩展名的文档。不幸的是,在我的情况下,不能将文件更改为扩展名。
我正在使用的命令就是:
$bin/post -c mycore ../foldertobescaned -type application/pdf
该命令适用于具有扩展名但我得到的文档:
进入自动模式。考虑的文件结尾是xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
非常感谢!
答案 0 :(得分:0)
如果不能重命名文件,则可以使用以下脚本作为解决方法,直到Solr改进其post方法。它是一个简单的bash for循环,可以单独提交每个文件,无论文件扩展名如何都可以工作。请注意,此脚本将比在整个文件夹上使用post更慢,因为需要初始化每个单独的文件传输。
将下面的脚本保存为Solr文件夹中的postFolderToSolr.sh
(以便Solrs bin/
文件夹是一个子目录),使其可以chmod +x postFolderToSolr.sh
执行,然后按如下方式使用它:{{ 1}}
不使用参数或错误数量的参数会打印一条简短的用法消息作为帮助。
./postFolderToSolr.sh mycore /home/user1/foldertobescaned/ application/pdf