我已经搜索了很多内容,但我还没有找到一个好的解决方案。
我想索引一个包含大量文件和底层文件夹的文件夹。 但我不知道如何索引它,我认为配置中的任何地方都必须有一条路径,但我还没找到。 请不要烤我,我是solr的新人。 ;)
答案 0 :(得分:0)
尝试使用Post工具
-Drecursive
param
让两个csv文件中的文件夹(test)和一个子文件夹(test2)里面有几个csv文件。 post工具递归检查文件夹test及其子文件夹test2中的所有文件以进行索引。
java -Dtype=text/csv -Dc=collection1 -Drecursive -jar post.jar test
-Dauto
param将索引tika可以处理的所有文件类型。
java -DDauto -Dc=collection1 -Drecursive -jar post.jar test
答案 1 :(得分:0)
FileListEntity处理器可用于索引文件路径。详细信息可在https://wiki.apache.org/solr/DataImportHandler#FileListEntityProcessor
中找到答案 2 :(得分:0)
完美,谢谢你们 索引工作!
但是我看到,那个solr并不是我需要的东西。 我需要一个Document / Index-Server,我可以用大约4GB的数据索引我的共享文件夹,我需要一个用户友好的搜索gui ... 索尔并不是那样的。