我使用内置的Tika插件将.doc和.pdfs上传到索引中。我设法上传了一些文件。但有些文件没有适当的字段,并且正在搞乱检索。
我现在希望检索整个索引以进行调试。我还想看看我的数据是如何存储的,以获得它的“感觉”。
如何获取整个索引或至少获取给定标识符的条目?
答案 0 :(得分:2)
如果您需要查看索引的外观,我建议使用Luke(Lucene Index Toolbox)。我在一个大的Solr索引上使用过一次它很好。
答案 1 :(得分:1)
我只引用Solr FAQ:
在大多数情况下这是不切实际的。人们通常只想做 当他们知道他们正在处理一个大小的索引时 保证结果集总是足够小 可行地以可管理的数量传输 - 但如果是这样的话 这种情况只是指定你认为“可管理的金额”作为你的 行param并获得两全其美(所有结果都是你的 假设是正确的,如果转变,则对结果大小设置一个理智上限 你的假设是错误的)
如果您想按标识符检索单个条目,则只需查询id:your_id
(将'id'替换为您的实际标识符字段,将'your_id'替换为实际的ID值)