我有一个Lucene的场景,我不确定(在阅读文档后)我的代码的最佳模式是什么。
基本上我的数据有很多(超过40种)不同的“形状”。例如,一个带有“标题”,“描述”和“正文”字段的新闻故事和一个技术性的kb类文章,其中包含“概述”,“问题”,“解决方案”,“解决方法”等字段。
我知道我可以在物理上索引这些不同的非统一问题,但我不太喜欢这个想法(我会搜索的项目类型的数量)我的查询最终会像标题一样:搜索或描述:搜索或正文:搜索或概述:搜索或......你明白了......
如果没有创建一个“标准”字段来获取数据,我有什么选择?
答案 0 :(得分:0)
您可以有1个字段来包含每个字段中的所有文本,然后还有按每个字段细分的文本。我在医学信息学方面看到了这项工作。