租户ID上每个表的SQL Server分区 - 使用的磁盘空间

时间:2012-10-02 09:50:16

标签: sql-server sql-server-2008 data-partitioning

我们目前正在开发一个多租户Web应用程序。 该应用程序将其所有数据存储在一个数据库中。

租户的数据行总是带有租户ID。

目前我们正在考虑创建表分区,租户ID为分区键。这是有道理的,因为99.9%的所有查询都将租户ID作为where子句标准包含在内。如果我理解正确,SQL Server查询通过消除不包含分区键的表分区(在我的情况下是租户ID)来优化所有此类查询。

对此策略的任何评论(严重的缺点,是否使用文件组等,每个表允许的最大分区...)将不胜感激。

但我的主要问题是: 我们想要计算每个租户的磁盘使用情况。 SQL Server支持报告每个分区的磁盘使用情况(标准报告)。 有没有人知道T-SQL允许我获取给定租户ID的所有表分区的磁盘使用情况?

1 个答案:

答案 0 :(得分:6)

这是Kendra Little对分区的一个很好的入门。它应该可以帮助您回答是否分区的问题。 http://www.brentozar.com/archive/2012/03/how-decide-if-should-use-table-partitioning/

我的一个建议是确保每个查询表都使用谓词中的分区消除。

对于文件组,请记住分区方案将分区映射到文件组。如果您想为每个租户创建一个文件组,这可能会变得复杂。

对于SQL Server 2005 - 2008 R2,1,000个分区是表可能包含的最大分区。 2012年,他们将限制增加到15,000个分区。如果需要更多,请将分区值空间分开,让范围确定数据将进入哪个分区。

这是一个表值函数,可用于通过分区导出空间使用情况:

CREATE FUNCTION tvfPartitionAllocationDetails (@schema_name sysname, @table_name sysname) 
RETURNS TABLE 
AS 
RETURN

select  f.data_space_id,
        f.NAME AS file_group_name,
        SCHEMA_NAME(t.schema_id) AS table_schema,
        t.name AS table_name,
        [HOBT?] = CASE pst.index_id WHEN 0 THEN 'HEAP' WHEN 1 THEN 'B-TREE' END,
        p.partition_number,
        ps.name AS partition_scheme_name,
        pf.name AS partition_function_name,
        partition_function_range = CASE pf.boundary_value_on_right WHEN 1 THEN 'RIGHT' WHEN 0 THEN 'LEFT' END,
        left_prv.value AS left_range,
        right_prv.value AS right_value,
        ISNULL(STR(CAST(left_prv.value AS BIGINT)), '-INF')
        + CASE WHEN pf.boundary_value_on_right = 0 THEN ' < '
               ELSE ' <= '
          END + 'X' + CASE WHEN pf.boundary_value_on_right = 0 THEN ' <= '
                           ELSE ' < '
                      END + ISNULL(STR(CAST(right_prv.value AS BIGINT)), 'INF') AS range_desc
        ,SUM(used_page_count) * 8 [TableSpaceUsed(KB)]
        ,(SELECT SUM(ISNULL(used_page_count,0)) * 8 FROM sys.dm_db_partition_stats  WHERE object_id = p.OBJECT_ID AND partition_number = p.partition_number AND index_id > 1) [NCIndexSpaceUsed(KB)]
        ,SUM(used_page_count) used_page_count
        ,row_count
from sys.dm_db_partition_stats pst
INNER JOIN sys.partitions p ON pst.partition_id = p.partition_id
JOIN    sys.tables t
        ON p.object_id = t.object_id
JOIN    sys.indexes i
        ON p.object_id = i.object_id
        AND p.index_id = i.index_id
JOIN    sys.allocation_units au
        ON p.hobt_id = au.container_id
JOIN    sys.filegroups f
        ON au.data_space_id = f.data_space_id
LEFT JOIN    sys.partition_schemes ps
        ON ps.data_space_id = i.data_space_id
LEFT JOIN    sys.partition_functions pf
        ON ps.function_id = pf.function_id
LEFT JOIN sys.partition_range_values left_prv
        ON left_prv.function_id = ps.function_id
           AND left_prv.boundary_id + 1 = p.partition_number
LEFT JOIN sys.partition_range_values right_prv
        ON right_prv.function_id = ps.function_id
           AND right_prv.boundary_id = p.partition_number
where pst.object_id = object_id(quotename(@schema_name) + '.' + quotename(@table_name)) 
    AND used_page_count > 0 
    AND pst.index_id IN (0,1)/*Remove Nonclustered index counts*/

GROUP BY f.data_space_id,
        f.NAME,
        t.schema_id,
        t.name,
        p.partition_number,
        ps.name,
        pf.name,
        pf.boundary_value_on_right,
        left_prv.value,
        right_prv.value,
        ISNULL(STR(CAST(left_prv.value AS BIGINT)), '-INF')
        + CASE WHEN pf.boundary_value_on_right = 0 THEN ' < '
               ELSE ' <= '
          END + 'X' + CASE WHEN pf.boundary_value_on_right = 0 THEN ' <= '
                           ELSE ' < '
                      END + ISNULL(STR(CAST(right_prv.value AS BIGINT)), 'INF') ,
        row_count,
        p.OBJECT_ID,
        pst.index_id;

然后你可以像这样查询表值函数:

SELECT * FROM dbo.tvfPartitionAllocationDetails('dbo','mytablename');

这假定没有超出行或lob页面。如果您有这些,并希望显示它们,则可以轻松地将它们添加到该功能中。