Lucene:单个"资源的多个文档"

时间:2014-03-15 17:25:37

标签: lucene full-text-indexing

我的模型包括在线课程。每个课程都有一个id号,一个​​标题,可以有不同数量的内容文件(大型html文件)。我尝试使用以下方案在Lucene中表示它们(每行都是一个文档):

  • 当然:“1”,标题:“Java简介”
  • 当然:“1”,内容:“第1章:基础......”
  • 当然:“1”,内容:“第2章:收藏......”
  • 当然:“2”,标题:“Java networking”
  • 当然:“2”,内容:“第一部分:插座......”
  • 当然:“3”,标题:......

但是现在,假设我需要让Lucene给我所有的课程(只是id),标题中包含“Java”,其中包含一些内容的“集合”。诸如title:java AND content:collections之类的查询将无效,因为信息被分成多个文档。

有人可以建议我一些替代表示或查询技术来解决这个问题吗?请注意,我不能将所有内容连接到一个文件中,并将其与标题一起索引在同一文档中,因为在创建课程后会添加一些章节。

提前致谢。

1 个答案:

答案 0 :(得分:0)