Apache Solr索引文件夹(和底层文件夹)

时间:2017-04-06 12:14:27

标签: apache indexing solr lucene

我已经搜索了很多内容,但我还没有找到一个好的解决方案。

我想索引一个包含大量文件和底层文件夹的文件夹。 但我不知道如何索引它,我认为配置中的任何地方都必须有一条路径,但我还没找到。 请不要烤我,我是solr的新人。 ;)

3 个答案:

答案 0 :(得分:0)

尝试使用Post工具   -Drecursive param

让两个csv文件中的文件夹(test)和一个子文件夹(test2)里面有几个csv文件。 post工具递归检查文件夹test及其子文件夹test2中的所有文件以进行索引。

java -Dtype=text/csv -Dc=collection1 -Drecursive -jar post.jar test

-Dauto param将索引tika可以处理的所有文件类型。

java -DDauto -Dc=collection1 -Drecursive -jar post.jar test

答案 1 :(得分:0)

FileListEntity处理器可用于索引文件路径。详细信息可在https://wiki.apache.org/solr/DataImportHandler#FileListEntityProcessor

中找到

答案 2 :(得分:0)

完美,谢谢你们 索引工作!

但是我看到,那个solr并不是我需要的东西。 我需要一个Document / Index-Server,我可以用大约4GB的数据索引我的共享文件夹,我需要一个用户友好的搜索gui ... 索尔并不是那样的。