我们目前正在开发一个多租户Web应用程序。 该应用程序将其所有数据存储在一个数据库中。
租户的数据行总是带有租户ID。
目前我们正在考虑创建表分区,租户ID为分区键。这是有道理的,因为99.9%的所有查询都将租户ID作为where子句标准包含在内。如果我理解正确,SQL Server查询通过消除不包含分区键的表分区(在我的情况下是租户ID)来优化所有此类查询。
对此策略的任何评论(严重的缺点,是否使用文件组等,每个表允许的最大分区...)将不胜感激。
但我的主要问题是: 我们想要计算每个租户的磁盘使用情况。 SQL Server支持报告每个分区的磁盘使用情况(标准报告)。 有没有人知道T-SQL允许我获取给定租户ID的所有表分区的磁盘使用情况?
答案 0 :(得分:6)
这是Kendra Little对分区的一个很好的入门。它应该可以帮助您回答是否分区的问题。 http://www.brentozar.com/archive/2012/03/how-decide-if-should-use-table-partitioning/
我的一个建议是确保每个查询表都使用谓词中的分区消除。
对于文件组,请记住分区方案将分区映射到文件组。如果您想为每个租户创建一个文件组,这可能会变得复杂。
对于SQL Server 2005 - 2008 R2,1,000个分区是表可能包含的最大分区。 2012年,他们将限制增加到15,000个分区。如果需要更多,请将分区值空间分开,让范围确定数据将进入哪个分区。
这是一个表值函数,可用于通过分区导出空间使用情况:
CREATE FUNCTION tvfPartitionAllocationDetails (@schema_name sysname, @table_name sysname)
RETURNS TABLE
AS
RETURN
select f.data_space_id,
f.NAME AS file_group_name,
SCHEMA_NAME(t.schema_id) AS table_schema,
t.name AS table_name,
[HOBT?] = CASE pst.index_id WHEN 0 THEN 'HEAP' WHEN 1 THEN 'B-TREE' END,
p.partition_number,
ps.name AS partition_scheme_name,
pf.name AS partition_function_name,
partition_function_range = CASE pf.boundary_value_on_right WHEN 1 THEN 'RIGHT' WHEN 0 THEN 'LEFT' END,
left_prv.value AS left_range,
right_prv.value AS right_value,
ISNULL(STR(CAST(left_prv.value AS BIGINT)), '-INF')
+ CASE WHEN pf.boundary_value_on_right = 0 THEN ' < '
ELSE ' <= '
END + 'X' + CASE WHEN pf.boundary_value_on_right = 0 THEN ' <= '
ELSE ' < '
END + ISNULL(STR(CAST(right_prv.value AS BIGINT)), 'INF') AS range_desc
,SUM(used_page_count) * 8 [TableSpaceUsed(KB)]
,(SELECT SUM(ISNULL(used_page_count,0)) * 8 FROM sys.dm_db_partition_stats WHERE object_id = p.OBJECT_ID AND partition_number = p.partition_number AND index_id > 1) [NCIndexSpaceUsed(KB)]
,SUM(used_page_count) used_page_count
,row_count
from sys.dm_db_partition_stats pst
INNER JOIN sys.partitions p ON pst.partition_id = p.partition_id
JOIN sys.tables t
ON p.object_id = t.object_id
JOIN sys.indexes i
ON p.object_id = i.object_id
AND p.index_id = i.index_id
JOIN sys.allocation_units au
ON p.hobt_id = au.container_id
JOIN sys.filegroups f
ON au.data_space_id = f.data_space_id
LEFT JOIN sys.partition_schemes ps
ON ps.data_space_id = i.data_space_id
LEFT JOIN sys.partition_functions pf
ON ps.function_id = pf.function_id
LEFT JOIN sys.partition_range_values left_prv
ON left_prv.function_id = ps.function_id
AND left_prv.boundary_id + 1 = p.partition_number
LEFT JOIN sys.partition_range_values right_prv
ON right_prv.function_id = ps.function_id
AND right_prv.boundary_id = p.partition_number
where pst.object_id = object_id(quotename(@schema_name) + '.' + quotename(@table_name))
AND used_page_count > 0
AND pst.index_id IN (0,1)/*Remove Nonclustered index counts*/
GROUP BY f.data_space_id,
f.NAME,
t.schema_id,
t.name,
p.partition_number,
ps.name,
pf.name,
pf.boundary_value_on_right,
left_prv.value,
right_prv.value,
ISNULL(STR(CAST(left_prv.value AS BIGINT)), '-INF')
+ CASE WHEN pf.boundary_value_on_right = 0 THEN ' < '
ELSE ' <= '
END + 'X' + CASE WHEN pf.boundary_value_on_right = 0 THEN ' <= '
ELSE ' < '
END + ISNULL(STR(CAST(right_prv.value AS BIGINT)), 'INF') ,
row_count,
p.OBJECT_ID,
pst.index_id;
然后你可以像这样查询表值函数:
SELECT * FROM dbo.tvfPartitionAllocationDetails('dbo','mytablename');
这假定没有超出行或lob页面。如果您有这些,并希望显示它们,则可以轻松地将它们添加到该功能中。