如何在RavenDB中使用多个分组创建map / reduce索引

时间:2015-01-21 05:40:56

标签: c# ravendb

我们正在Raven中存储一组文档。

public class MyDocument
{
  public string Id { get; set; }
  public string DocumentType { get; set; }
  public int ClientId { get; set; }
  public string Status { get; set; }
}

我们希望显示按ClientId和DocumentType分组的文档报告,如下所示:

DocumentType  ClientHasManyOfThese Count Action
------------- -------------------- ----- ---------------------
DocumentType1 Yes                  10    LinkToListOfDocuments
DocumentType1 No                   5     LinkToListOfDocuments
DocumentType2 Yes                  12    LinkToListOfDocuments
DocumentType2 No                   15    LinkToListOfDocuments

我创建了以下索引,但它只返回少量文档的正确结果。

public class MyDocumentCount
{
  public string DocumentType { get; set; }
  public int ClientId { get; set; }
  public int Count { get; set; }
  public bool MultipleDocumentsForClient { get; set; }
}

public class MyIndex : AbstractIndexCreationTask<MyDocument, MyDocumentCount>
{
  public MyIndex()
  {
    Map = tasks => 
      from task in tasks
      where task.Status = "Show In Report"
      select new MyDocumentCount
      {
        DocumentType = task.DocumentType,
        ClientId = task.ClientId,
        MultipleDocumentsForClient = false,
        Count = 1
      };

    Reduce = results =>
      results.GroupBy(result => new 
      {
        result.DocumentType, 
        result.ClientId
      }).Select(conDocGrp => new MyDocumentCount 
      {
        DocumentType = conDocGrp.Key.DocumentType,
        Count = conDocGrp.Sum(result => result.Count),
        MultipleDocumentsForClient = conDocGrp.Sum(result => result.Count) > 1,
        ClientId = conDocGrp.Key.ClientId
      });

    TransformResults = (database, results) =>
      results.GroupBy(result => new
      {
        result.DocumentType,
        result.MultipleDocumentsForClient
      }).Select(multDocGrp => new
      {
        multDocGrp.Key.DocumentType,
        multDocGrp.Key.MultipleDocumentsForClient,
        Count = multDocGrp.Sum(result => int.Parse(result.Count.ToString(CultureInfo.InvariantCulture))),
        ClientId = 0
      });
  }
}

我相信它在调用时与Raven中的结果计数限制有关:

var results = session.Query<MyDocumentCount, MyIndex>().ToList();

在执行转换之前,可能会将限制应用于索引结果吗?

有人能告诉我我做错了什么,是否有办法实现我想要的东西?

我们目前正在运行RavenDB(Server Build 2380)。

感谢。

1 个答案:

答案 0 :(得分:2)

因此,我可以收集的问题的基本要点是,您正在尝试聚合聚合。具体来说,您尝试按ClientIdDocumentType进行分组,然后尝试按MultipleDocumentsForClient汇总这些结果。您的索引适用于大多数情况,但当Reduce产生的结果超过默认的RavenDB“页面大小”限制时,您无法获得所需的输出。

我确认TransformResults只能从RavenDB获得最大页面限制大小。您可以将TransformResults视为在客户端执行,以确保您以后不会犯任何错误。也许这就是它被弃用的原因,我们应该改用变形金刚。

为了解决你现在的问题,我认为你在一个索引中做得太多了。变换器部分实际上并不用于转换查询结果,而是用于再次聚合。 如果您无法在索引的Reduce部分中进行所有聚合,那么我建议您尝试将索引拆分为两个较小的索引。也许在这种情况下,一个索引可以用于客户端具有多个文档,一个索引可以用于客户端具有单个文档的时间。然后你必须将两个结果加载到内存中,这似乎适合你的情况,因为你已经在查询中使用.ToList