从多个来源过滤,合并,排序和分页数据

时间:2016-11-10 08:41:53

标签: c# caching merge pagination iqueryable

目前我通过检索<select>的方法从数据库中检索数据,过滤,排序然后对其进行分页(所有这些基本上都在DB上),然后将结果返回给用于在分页表格中显示的UI。

我需要整合来自另一个数据库的结果,而分页似乎是主要问题。

  • 模型相似但不相同(相同的字段,不同的名称,在返回之前需要映射到通用域模型);
  • 无法在DB级别加入;
  • 目前在两个DB之间有大约1000条记录(在此期间添加) 过去18个月),并且可能会大致相同(慢) 步伐;
  • 结果总是需要按1-2个字段排序(按日期排序)。

我目前在这两个解决方案之间徘徊:

  1. 从两个源中检索所有数据,合并,排序然后缓存它们;然后在接收请求时简单地对所述缓存进行过滤和分页 - 但是我需要在修改集合时使缓存无效(我可以);
  2. 过滤每个来源的数据(同样,在数据库级别),然后检索,合并,排序和在返回之前将它们分页。
  3. 我希望在性能方面找到一个不错的算法。理想的解决方案可能是它们之间的组合(缓存+数据库级别的过滤),但我现在还没有解决这个问题。

2 个答案:

答案 0 :(得分:1)

我认为您可以使用以下算法。假设您的页面大小为10,那么对于第0页:

  1. 从数据库A获取10个结果,在数据库级别进行过滤和排序。
  2. 从数据库B获取10个结果,在数据库级别进行过滤和排序(与上述查询并行)
  3. 将这两个结果组合在一起,以正确的排序顺序获取10条记录。因此,您排序了20条记录,但只占用其中的前10条,并在UI中显示
  4. 然后是第1页:

    1. 注意您在上一步中用于在UI中显示的数据库A和B中有多少项。例如,您使用了数据库A中的2个项目和数据库B中的8个项目。
    2. 从数据库A中获取10个结果,进行过滤和排序,但从位置2开始(跳过2),因为这两个已经在UI中显示。
    3. 从数据库B中获取10个结果,进行过滤和排序,但从第8位开始(跳过8)。
    4. 以与上面相同的方式合并从20获得10条记录。假设现在你使用了A中的5项和来自B中的5项。现在,总共显示了来自A的7项和来自B的13项。使用这些下一步的数字。
    5. 这不允许(轻松)跳过页面,但据我所知,这不是必需的。

      性能应该与查询单个数据库时的性能有效,因为对A和B的查询可以并行完成。

答案 1 :(得分:0)

我在这里创造了一些东西,如果需要,我会回来说明。 我不确定我的算法是否适用于所有边缘情况,它涵盖了我想到的所有情况,但你永远不会知道。我将把代码保留在这里以供您使用,我将回答并解释如果您需要的话,在那里做了什么,发表评论。

使用值之间存在较大间隙的项目列表执行多项测试。

using System;
using System.Collections.Generic;
using System.Linq;

namespace ConsoleApplication1
{
    class Program
    {
        //each time when this objects are accessed, consider as a database call
        private static IQueryable<model1> dbsetModel_1; 
        private static IQueryable<model2> dbsetModel_2;

        private static void InitDBSets()
        {
            var rnd = new Random();
            List<model1> dbsetModel1 = new List<model1>();
            List<model2> dbsetModel2 = new List<model2>();
            for (int i = 1; i < 300; i++)
            {
                if (i % 2 == 0)
                {
                    dbsetModel1.Add(new model1() { Id = i, OrderNumber = rnd.Next(1, 10), Name = "Test " + i.ToString() });
                }
                else
                {
                    dbsetModel2.Add(new model2() { Id2 = i, OrderNumber2 = rnd.Next(1, 10), Name2 = "Test " + i.ToString() });
                }
            }
            dbsetModel_1 = dbsetModel1.AsQueryable();
            dbsetModel_2 = dbsetModel2.AsQueryable();
        }

        public static void Main()
        {
            //generate sort of db data
            InitDBSets();
            //test
            var result2 = GetPage(new PagingFilter() { Page = 5, Limit = 10 });
            var result3 = GetPage(new PagingFilter() { Page = 6, Limit = 10 });
            var result5 = GetPage(new PagingFilter() { Page = 7, Limit = 10 });
            var result6 = GetPage(new PagingFilter() { Page = 8, Limit = 10 });
            var result7 = GetPage(new PagingFilter() { Page = 4, Limit = 20 });
            var result8 = GetPage(new PagingFilter() { Page = 200, Limit = 10 });

        }


        private static PagedList<Item> GetPage(PagingFilter filter)
        {
            int pos = 0;
            //load only start pages intervals margins from both database
            //this part need to be transformed in a stored procedure on db one, skip, take to return interval start value for each frame 
            var framesBordersModel1 = new List<Item>();
            dbsetModel_1.OrderBy(x => x.Id).ThenBy(z => z.OrderNumber).ToList().ForEach(i => {
                pos++;
                if (pos - 1 == 0)
                {
                    framesBordersModel1.Add(new Item() { criteria1 = i.Id, criteria2 = i.OrderNumber, model = i });
                }
                else if ((pos - 1) % filter.Limit == 0)
                {
                    framesBordersModel1.Add(new Item() { criteria1 = i.Id, criteria2 = i.OrderNumber, model = i });
                }

            });
            pos = 0;
            //this part need to be transformed in a stored procedure on db two, skip, take to return interval start value for each frame
            var framesBordersModel2 = new List<Item>();
            dbsetModel_2.OrderBy(x => x.Id2).ThenBy(z => z.OrderNumber2).ToList().ForEach(i => {
                pos++;
                if (pos - 1 == 0)
                {
                    framesBordersModel2.Add(new Item() { criteria1 = i.Id2, criteria2 = i.OrderNumber2, model = i });
                }
                else if ((pos -1) % filter.Limit == 0)
                {
                    framesBordersModel2.Add(new Item() { criteria1 = i.Id2, criteria2 = i.OrderNumber2, model = i });
                }

            });

            //decide where is the position of your cursor based on start margins
            //int mainCursor = 0;
            int cursor1 = 0;
            int cursor2 = 0;
            //filter pages start from 1, filter.Page cannot be 0, if indeed you have page 0 change a lil' bit he logic 
            if (framesBordersModel1.Count + framesBordersModel2.Count < filter.Page) throw new Exception("Out of range");
            while ( cursor1 + cursor2 < filter.Page -1)
            {
                if (framesBordersModel1[cursor1].criteria1 < framesBordersModel2[cursor2].criteria1)
                {
                    cursor1++;
                }
                else if (framesBordersModel1[cursor1].criteria1 > framesBordersModel2[cursor2].criteria1)
                {
                    cursor2++;
                }
                //you should't get here case main key sound't be duplicate, annyhow
                else
                {
                    if (framesBordersModel1[cursor1].criteria2 < framesBordersModel2[cursor2].criteria2)
                    {
                        cursor1++;
                    }
                    else
                    {
                        cursor2++;
                    }
                }
                //mainCursor++;
            }
            //magic starts
            //inpar skipable
            int skipEndResult = 0;
            List<Item> dbFramesMerged = new List<Item>();
            if ((cursor1 + cursor2) %2 == 0)
            {
                dbFramesMerged.AddRange(
                    dbsetModel_1.OrderBy(x => x.Id)
                        .ThenBy(z => z.OrderNumber)
                        .Skip(cursor1*filter.Limit)
                        .Take(filter.Limit)
                        .Select(x => new Item() {criteria1 = x.Id, criteria2 = x.OrderNumber, model = x})
                        .ToList()); //consider as db call EF or Stored Procedure
                dbFramesMerged.AddRange(
                    dbsetModel_2.OrderBy(x => x.Id2)
                        .ThenBy(z => z.OrderNumber2)
                        .Skip(cursor2*filter.Limit)
                        .Take(filter.Limit)
                        .Select(x => new Item() {criteria1 = x.Id2, criteria2 = x.OrderNumber2, model = x})
                        .ToList());
                ; //consider as db call EF or Stored Procedure
            }
            else
            {
                skipEndResult = filter.Limit;
                if (cursor1 > cursor2)
                {
                    cursor1--;
                }
                else
                {
                    cursor2--;
                }
                dbFramesMerged.AddRange(
                   dbsetModel_1.OrderBy(x => x.Id)
                       .ThenBy(z => z.OrderNumber)
                       .Skip(cursor1 * filter.Limit)
                       .Take(filter.Limit)
                       .Select(x => new Item() { criteria1 = x.Id, criteria2 = x.OrderNumber, model = x })
                       .ToList()); //consider as db call EF or Stored Procedure
                dbFramesMerged.AddRange(
                    dbsetModel_2.OrderBy(x => x.Id2)
                        .ThenBy(z => z.OrderNumber2)
                        .Skip(cursor2 * filter.Limit)
                        .Take(filter.Limit)
                        .Select(x => new Item() { criteria1 = x.Id2, criteria2 = x.OrderNumber2, model = x })
                        .ToList());
            }

            IQueryable<Item> qItems = dbFramesMerged.AsQueryable();
            PagedList<Item> result = new PagedList<Item>();
            result.AddRange(qItems.OrderBy(x => x.criteria1).ThenBy(z => z.criteria2).Skip(skipEndResult).Take(filter.Limit).ToList());

            //here again you need db cals to get total count
            result.Total = dbsetModel_1.Count() + dbsetModel_2.Count();
            result.Limit = filter.Limit;
            result.Page = filter.Page;
            return result;
        }
    }

    public class PagingFilter
    {
        public int Limit { get; set; }
        public int Page { get; set; }
    }



    public class PagedList<T> : List<T>
    {

        public int Total { get; set; }
        public int? Page { get; set; }
        public int? Limit { get; set; }
    }

    public class Item : Criteria
    {
        public object model { get; set; }
    }

    public class Criteria
    {
        public int criteria1 { get; set; }
        public int criteria2 { get; set; }
        //more criterias if you need to order
    }

    public class model1
    {
        public int Id { get; set; }
        public int OrderNumber { get; set; }
        public string Name { get; set; }
    }

    public class model2
    {
        public int Id2 { get; set; }
        public int OrderNumber2 { get; set; }
        public string Name2 { get; set; }
    }
}