强制SQL Server将整个数据库预先缓存到内存中

时间:2014-05-22 20:06:09

标签: sql-server caching memory

我们在具有100+ Gb RAM的服务器上有一个带有50Gb SQL 2012数据库的客户端站点。

在使用应用程序时,SQL服务器可以很好地将数据库缓存到内存中,但是缓存的性能提升发生在查询运行的第二次,而不是第一次。

为了在第一次运行查询时尝试最大化缓存命中,我们编写了一个proc,它遍历整个数据库中每个表的每个索引,运行这个:

SELECT * INTO #Cache 
FROM ' + @tablename + ' WITH (INDEX (' + @indexname + '))'

试图强迫大量,丑陋,人为的阅读尽可能多的数据。 我们计划每15分钟运行一次,并且它总体上做得很好。

在没有讨论其他瓶颈,硬件规格,查询计划或查询优化的情况下,是否有人对如何完成同样的任务有更好的想法?

更新
谢谢你的建议。删除了" INTO#Cache"。经过测试和测试填充缓冲区并没有什么不同。
补充:我只选择索引中的键,而不是选择*。这(显然)更为重要,速度更快 补充:阅读&缓存约束索引。

这是当前的代码:(希望它对其他人有用)

CREATE VIEW _IndexView
as
-- Easy way to access sysobject and sysindex data
SELECT 
so.name as tablename,
si.name as indexname,
CASE si.indid WHEN 1 THEN 1 ELSE 0 END as isClustered,
CASE WHEN (si.status & 2)<>0 then 1 else 0 end as isUnique,
dbo._GetIndexKeys(so.name, si.indid) as Keys,
    CONVERT(bit,CASE WHEN EXISTS (SELECT * FROM sysconstraints sc WHERE object_name(sc.constid) = si.name) THEN 1 ELSE 0 END) as IsConstraintIndex
FROM    sysobjects so
INNER JOIN sysindexes si ON so.id = si.id
WHERE   (so.xtype = 'U')--User Table
AND     ((si.status & 64) = 0) --Not statistics index
AND (   (si.indid = 0) AND (so.name <> si.name) --not a default clustered index
        OR
        (si.indid > 0)
    )
AND si.indid <> 255 --is not a system index placeholder

UNION
SELECT 
so.name as tablename,
si.name as indexname,
CASE si.indid WHEN 1 THEN 1 ELSE 0 END as isClustered,
CASE WHEN (si.status & 2)<>0 then 1 else 0 end as isUnique,
dbo._GetIndexKeys(so.name, si.indid) as Keys,
CONVERT(bit,0) as IsConstraintIndex
FROM    sysobjects so
INNER JOIN sysindexes si ON so.id = si.id
WHERE   (so.xtype = 'V')--View
AND     ((si.status & 64) = 0) --Not statistics index
GO


CREATE PROCEDURE _CacheTableToSQLMemory
@tablename varchar(100)
AS
BEGIN
DECLARE @indexname varchar(100)
DECLARE @xtype varchar(10)
DECLARE @SQL varchar(MAX)
DECLARE @keys varchar(1000)

DECLARE @cur CURSOR
SET @cur = CURSOR FOR
SELECT  v.IndexName, so.xtype, v.keys
FROM    _IndexView v
INNER JOIN sysobjects so ON so.name = v.tablename
WHERE   tablename = @tablename

PRINT 'Caching Table ' + @Tablename
OPEN @cur
FETCH NEXT FROM @cur INTO @indexname, @xtype, @keys
WHILE (@@FETCH_STATUS = 0)
BEGIN
        PRINT '    Index ' + @indexname
        --BEGIN TRAN
            IF @xtype = 'V'
                SET @SQL = 'SELECT ' + @keys + ' FROM ' + @tablename + ' WITH (noexpand, INDEX (' + @indexname + '))' --
            ELSE
                SET @SQL = 'SELECT ' + @keys + ' FROM ' + @tablename + ' WITH (INDEX (' + @indexname + '))' --

            EXEC(@SQL)
        --ROLLBACK TRAN
        FETCH NEXT FROM @cur INTO @indexname, @xtype, @keys
END
CLOSE @cur
DEALLOCATE @cur

END
GO

3 个答案:

答案 0 :(得分:19)

首先,有一个名为“Minumum Server Memory”的设置看起来很诱人。忽略它。 From MSDN:

  

数据库引擎获取的内存量完全取决于实例上的工作负载。未处理许多请求的SQL Server实例可能永远不会到达最小服务器内存。

这告诉我们设置更大的最小内存不会强制或鼓励任何预缓存。您可能有other reasons to set this,但预填充缓冲池不是其中之一。

那么你可以做些什么来预加载数据呢?这很简单。只需设置代理作业即可从每个表中执行select *。您可以将其安排为“在Sql Agent启动时自动启动”。换句话说,你已经在做的事情非常接近于处理这个问题的标准方法。

但是,我确实需要提出三点修改:

  1. 不要尝试使用临时表。只需从表中选择即可。您无需对结果执行任何操作即可使Sql Server加载缓冲池:您需要做的就是选择。一个临时表可以强制sql server在加载后从缓冲池中复制数据......你最终(简要地)存储两次
  2. 不要每15分钟运行一次。只需在启动时运行一次,然后不管它。一旦分配,Sql Server释放内存需要很多。只是不需要一遍又一遍地重新运行它。
  3. 不要试图暗示索引。提示只是:提示。 Sql Server可以自由地忽略这些提示,并且它将对没有明确用于索引的查询执行此操作。确保索引预先加载的最佳方法是构造一个显然使用该索引的查询。这里的一个具体建议是以与索引相同的顺序对结果进行排序。这通常会帮助Sql Server使用该索引,因为它可以“遍历索引”以产生结果。

答案 1 :(得分:1)

这不是答案,但为了补充Joel Coehoorn的答案,您可以使用此语句查看缓存中的表数据。使用它来确定是否所有页面都保留在缓存中:

USE DBMaint
GO
SELECT COUNT(1) AS cached_pages_count, SUM(s.used_page_count)/COUNT(1) AS total_page_count,
name AS BaseTableName, IndexName,
IndexTypeDesc
FROM sys.dm_os_buffer_descriptors AS bd
INNER JOIN
(
SELECT s_obj.name, s_obj.index_id,
s_obj.allocation_unit_id, s_obj.OBJECT_ID,
i.name IndexName, i.type_desc IndexTypeDesc
FROM
(
SELECT OBJECT_NAME(OBJECT_ID) AS name,
index_id ,allocation_unit_id, OBJECT_ID
FROM sys.allocation_units AS au
INNER JOIN sys.partitions AS p
ON au.container_id = p.hobt_id
AND (au.type = 1 OR au.type = 3)
UNION ALL
SELECT OBJECT_NAME(OBJECT_ID) AS name,
index_id, allocation_unit_id, OBJECT_ID
FROM sys.allocation_units AS au
INNER JOIN sys.partitions AS p
ON au.container_id = p.partition_id
AND au.type = 2
) AS s_obj
LEFT JOIN sys.indexes i ON i.index_id = s_obj.index_id
AND i.OBJECT_ID = s_obj.OBJECT_ID ) AS obj
ON bd.allocation_unit_id = obj.allocation_unit_id
INNER JOIN sys.dm_db_partition_stats s ON s.index_id = obj.index_id AND s.object_id = obj.object_ID
WHERE database_id = DB_ID()
GROUP BY name, obj.index_id, IndexName, IndexTypeDesc
ORDER BY obj.name;
GO

答案 2 :(得分:0)

用它来替换函数 dbo._GetIndexKeys

(SELECT STRING_AGG(COL_NAME(ic.object_id,ic.column_id), ',') FROM sys.index_columns ic WHERE ic.object_id = so.id AND ic.index_id = si.indid) AS 键,

--dbo._GetIndexKeys(so.name, si.indid) 作为键,