我完全迷失了。 我想我肯定错过了一些基本的东西。每个人都有这么棒的东西可以说Solr,但我没有看到它。
我在Solr索引了一个结构化的pdf文档。 问题是当我搜索一个简单的字符串时 - 我将整个内容字段作为响应! 我不知道如何改变它。 我的要求是,让我说我搜索“元数据” 它应该给我
“ MetadataDiscussion ... 4匹配 ...确保Tika用户有机会获得Tika创建和/或提取的所有元数据。 ==原始问题==这个页面的原始灵感是Tika ... 10.7k - rev:2(当前) 最后修改时间:2010-08-02 18:09:45 “
但它给了我整个文档! - 索引的整个字符串。 似乎Lucene只能告诉我它出现在哪个领域,而不是它在哪个领域出现
任何帮助将不胜感激!!
答案 0 :(得分:0)
Lucene / Solr主要是一个检索引擎 - 它检索与查询匹配的文档。所以这种行为是可取的和期望的。现在,根据您的要求,您可以使用Solr的highlighting功能来准确地为您提供。假设您的文档文本存储在名为text
的字段中 - 然后您将以下参数传递给Solr:
&hl=true&hl.fl=text&hl.snippets=5&hl.fragsize=200
查看其他参数以进一步自定义它。
Solr 太棒了:))