使用Entity Framework执行简单查询时出现严重的性能问题

时间:2012-07-30 18:37:53

标签: c# performance entity-framework entity-framework-4

我有一个相当通用的CRUD webapp,它根据几个数据库表的内容动态生成页面。我正在使用Entity Framework 4.0将这些数据从数据库中提取出来,但是我遇到了严重的性能问题。我已经设法迭代到一个足够包含的问题,我可以在下面详述。

我有一个包含页面表单(~200)列表的表格。每个表单都有一个或多个字段(总共约4000个),每个字段可能有一些参数(总共约16000个)。

我在下面附上了我的模特的截图:

Entity model

关联的实体对象如下:

public class Form
{
    public int FormID { get; set; }
    public string FormName { get; set; }

    public IList<FormField> FormFields { get; set; }

}

public class FormField
{
    public int FieldID { get; set; }
    public string FieldName { get; set; }
    public int FormID{ get; set; } 

    public IList<FormFieldParameter> FormFieldParameters { get; set; }
    public Form ParentForm { get; set; }

}

public class FormFieldParameter
{
    public int FieldParamID{ get; set; }
    public string Value{ get; set; }
    public int? FieldID { get; set; }

    public FormField ParentField { get; set; }
}

以下代码提取ID为“1”的表单的所有数据。

EntityConnection myConnection = new EntityConnection("name=myModel");

if(conn.State != ConnectionState.Open) {
    conn.Open();
}
ObjectContext context = new ObjectContext("name=myModel");
context.ContextOptions.LazyLoadingEnabled = false;

ObjectQuery<PageForm> myObjectSet = context.CreateObjectSet<PageForm>()
                                           .Include("FormField.FormFieldParameter");

//Edit: I missed this part out, sorry. In hindsight, this was exactly what was
//causing the issue.
IEnumerable<PageForm> myObjectSetEnumerable = myObjectSet.AsEnumerable();
IQueryable<PageForm> myFilteredObjectSet = myObjectSetEnumerable.Where(c => c.FormID == 1)
                                                                .AsQueryable();


List<PageForm> myReturnValue = myFilteredObjectSet.toList();

现在,虽然这确实有效,但它运行得非常糟糕。查询需要花费一秒钟才能运行,其全部内容都花费在myFilteredObjectSet.toList()调用中。我在我的数据库上运行了一个分析器来查看导致延迟的原因,并发现正在生成以下查询:

SELECT 
[Project1].[FormID] AS [FormID], 
[Project1].[FormName] AS [FormName], 
[Project1].[C2] AS [C1], 
[Project1].[FormID1] AS [FormID1], 
[Project1].[FieldID] AS [FieldID], 
[Project1].[FieldName] AS [FieldName], 
[Project1].[C1] AS [C2], 
[Project1].[FieldParamID] AS [FieldParamID], 
[Project1].[Value] AS [Value], 
[Project1].[FieldID1] AS [FieldID1]
FROM ( SELECT 
    [Extent1].[FormID] AS [FormID], 
    [Extent1].[FormName] AS [FormName], 
    [Join1].[FieldID] AS [FieldID], 
    [Join1].[FieldName] AS [FieldName], 
    [Join1].[FormID] AS [FormID1], 
    [Join1].[FieldParamID] AS [FieldParamID], 
    [Join1].[Value] AS [Value], 
    [Join1].[FieldID1] AS [FieldID1], 
    CASE WHEN ([Join1].[FieldID] IS NULL) THEN CAST(NULL AS int) WHEN ([Join1].[FieldParamID] IS NULL) THEN CAST(NULL AS int) ELSE 1 END AS [C1], 
    CASE WHEN ([Join1].[FieldID] IS NULL) THEN CAST(NULL AS int) ELSE 1 END AS [C2]
    FROM  [dbo].[PageForm] AS [Extent1]
    LEFT OUTER JOIN  (SELECT [Extent2].[FieldID] AS [FieldID], [Extent2].[FieldName] AS [FieldName], [Extent2].[FormID] AS [FormID], [Extent3].[FieldParamID] AS [FieldParamID], [Extent3].[Value] AS [Value], [Extent3].[FieldID] AS [FieldID1]
        FROM  [dbo].[FormField] AS [Extent2]
        LEFT OUTER JOIN [dbo].[FormFieldParameter] AS [Extent3] ON [Extent2].[FieldID] = [Extent3].[FieldID] ) AS [Join1] ON [Extent1].[FormID] = [Join1].[FormID]
)  AS [Project1]
ORDER BY [Project1].[FormID] ASC, [Project1].[C2] ASC, [Project1].[FieldID] ASC, [Project1].[C1] ASC

sql profiler上显示的此查询的持续时间显示此查询正在运行这么长时间。关于查询的有趣之处在于它根本没有对它进行过滤 - 它返回整个树!我无法理解为什么它会返回所有内容,因为过滤器myObjectSet.Where(c => c.FormID == 1)非常明确。实际返回的对象只包含一个我想要的条目。

我在整个数据访问层中遇到此问题,其性能令人震惊。我不知道为什么生成的查询不包含过滤器 - 并且不知道如何告诉它这样做。有人知道答案吗?

1 个答案:

答案 0 :(得分:3)

TL; DR删除AsEnumerable调用并将其替换为AsQueryable调用,它应解决大多数性能问题(实际数据库执行成本之外的速度很慢,这可通过添加索引来解决)在您要过滤/加入的列上。

解释实际发生的事情......

只要您调用AsEnumerable,您就会出现在Entity Framework之外以及LINQ-to-objects的世界中。这意味着它将在枚举时针对数据库执行查询。您再次调用AsQueryable并不重要,这仅仅意味着您正在针对内存结构创建查询。

有效执行是这样的。

  1. 创建对象查询,包括链接到表单
  2. 的所有FormFieldProperties
  3. 将当前IQueryable实例转换为可枚举的。
  4. 针对可枚举实例添加谓词,该实例仅返回FormID值为1的项目。
  5. 调用ToList,将所有值从源可枚举复制到列表。
  6. 现在,直到第4步,查询实际上还没有查询数据库。当您致电ToList时,它会在第一步中执行查询(如您所见)。此查询可能很昂贵并且需要一段时间,因为它返回的数据量和/或缺少的索引可能会提高它的性能。

    完成该查询并实现后,其结果将包含在枚举器中。

    现在,迭代并检查每个对象以查看它是否与在步骤3中添加的谓词匹配。如果它匹配,则返回给在其上迭代的任何对象(在本例中为ToList函数)。

    现在已返回该值,它将添加到使用值创建的列表中。

    最后,你从ToList方法获得了一个列表,它完全符合你的要求,但它在内存而不是在数据库中完成所有这些。