Indexing in Apche Solr of all files contained in a folder and its subfolders

时间:2016-08-31 12:13:02

标签: indexing solr

Can Apache Solr be used to index all the files of a folder(Parent) and its subfolders, containing files of all types: XML, .json, .pdf,.doc etc..?

3 个答案:

答案 0 :(得分:0)

可以使用post工具

if free = []: print ("no free") else: print ("free: ", free)

-dauto表示solr可以处理的所有文件类型

-Dc指定集合名称

- 如果文件夹中包含子文件夹中的文件,则处理错误。

如果文件夹有子文件夹,它将索引子文件夹中的文件

答案 1 :(得分:0)

您需要使用数据导入处理程序来实现这一目标。您可以在http://wiki.apache.org/solr/DataImportHandler找到有关如何实施该信息的信息。数据导入处理程序有一个recursive = true选项,允许您索引嵌套在文件夹中的文件。通过链接中的文档,您将找到适合自己的解决方案。希望这有助于:)。

答案 2 :(得分:0)

最新的Solr实际上附带了一个示例,展示了如何做到这一点,包括一个自定义界面。该示例位于 examples / files 中,您只需按照 README.txt 说明进行操作。