Question

我们正在Raven中存储一组文档。

public class MyDocument
{
  public string Id { get; set; }
  public string DocumentType { get; set; }
  public int ClientId { get; set; }
  public string Status { get; set; }
}

我们希望显示按ClientId和DocumentType分组的文档报告，如下所示：

DocumentType  ClientHasManyOfThese Count Action
------------- -------------------- ----- ---------------------
DocumentType1 Yes                  10    LinkToListOfDocuments
DocumentType1 No                   5     LinkToListOfDocuments
DocumentType2 Yes                  12    LinkToListOfDocuments
DocumentType2 No                   15    LinkToListOfDocuments

我创建了以下索引，但它只返回少量文档的正确结果。

public class MyDocumentCount
{
  public string DocumentType { get; set; }
  public int ClientId { get; set; }
  public int Count { get; set; }
  public bool MultipleDocumentsForClient { get; set; }
}

public class MyIndex : AbstractIndexCreationTask<MyDocument, MyDocumentCount>
{
  public MyIndex()
  {
    Map = tasks => 
      from task in tasks
      where task.Status = "Show In Report"
      select new MyDocumentCount
      {
        DocumentType = task.DocumentType,
        ClientId = task.ClientId,
        MultipleDocumentsForClient = false,
        Count = 1
      };

    Reduce = results =>
      results.GroupBy(result => new 
      {
        result.DocumentType, 
        result.ClientId
      }).Select(conDocGrp => new MyDocumentCount 
      {
        DocumentType = conDocGrp.Key.DocumentType,
        Count = conDocGrp.Sum(result => result.Count),
        MultipleDocumentsForClient = conDocGrp.Sum(result => result.Count) > 1,
        ClientId = conDocGrp.Key.ClientId
      });

    TransformResults = (database, results) =>
      results.GroupBy(result => new
      {
        result.DocumentType,
        result.MultipleDocumentsForClient
      }).Select(multDocGrp => new
      {
        multDocGrp.Key.DocumentType,
        multDocGrp.Key.MultipleDocumentsForClient,
        Count = multDocGrp.Sum(result => int.Parse(result.Count.ToString(CultureInfo.InvariantCulture))),
        ClientId = 0
      });
  }
}

我相信它在调用时与Raven中的结果计数限制有关：

var results = session.Query<MyDocumentCount, MyIndex>().ToList();

在执行转换之前，可能会将限制应用于索引结果吗？

有人能告诉我我做错了什么，是否有办法实现我想要的东西？

我们目前正在运行RavenDB（Server Build 2380）。

感谢。

Answer 1

因此，我可以收集的问题的基本要点是，您正在尝试聚合聚合。具体来说，您尝试按ClientId和DocumentType进行分组，然后尝试按MultipleDocumentsForClient汇总这些结果。您的索引适用于大多数情况，但当Reduce产生的结果超过默认的RavenDB“页面大小”限制时，您无法获得所需的输出。

我确认TransformResults只能从RavenDB获得最大页面限制大小。您可以将TransformResults视为在客户端执行，以确保您以后不会犯任何错误。也许这就是它被弃用的原因，我们应该改用变形金刚。

为了解决你现在的问题，我认为你在一个索引中做得太多了。变换器部分实际上并不用于转换查询结果，而是用于再次聚合。如果您无法在索引的Reduce部分中进行所有聚合，那么我建议您尝试将索引拆分为两个较小的索引。也许在这种情况下，一个索引可以用于客户端具有多个文档，一个索引可以用于客户端具有单个文档的时间。然后你必须将两个结果加载到内存中，这似乎适合你的情况，因为你已经在查询中使用.ToList。

如何在RavenDB中使用多个分组创建map / reduce索引

1 个答案: