如何按月对表进行分区(“两年”和“月”)并自动创建每月分区?

时间:2015-08-10 15:55:22

标签: sql sql-server partitioning dynamic-sql sql-agent-job

我正在尝试按对表进行分区。我将分区的列是具有ISO格式('20150110',20150202'等)的日期时间类型列。

例如,我有2010年,2011年,2012年的销售数据。我希望按年划分数据,每年也按月划分数据。 (2010 / 01,2010 / 02,...... 2010 / 12,2011 / 01,... 2015/01 ......)

E.X:

Sales2010Jan,Sales2010Feb,Sales2011Jan,Sales2011Feb,Sales2012Dec等。

我的问题是:它甚至可能吗?如果是,我如何使用SSIS自动化流程?

1 个答案:

答案 0 :(得分:16)

SSIS是ETL(提取,转换,加载)。这不是你想要做的。 您只需要动态创建DDL语句。

我在下面的四分之一下工作,但是如果你愿意,它可以在1,2或X个月工作。

  

如果要对表进行分区,首先需要创建文件,文件组和分区表并手动设置分区

在具有int标识PK和datetime2分区列的表上为2015 Q1(之前,第1季度和第2季之后)创建N + 1个分区。 更新它以添加月份,每月或任何你需要的...

  • 首先创建N个文件组:

    Alter Database [Test] Add Filegroup [Part_Before2015]
    Go
    Alter Database Test Add Filegroup [Part_201501]
    Go
    Alter Database Test Add Filegroup [Part_201504]
    Go
    
  • 为每个文件组添加文件:

    Alter Database [Test] Add FILE ( NAME = N'Part_Before2015', FILENAME = N'...\Part_Before2015.ndf' , SIZE = 5120KB , FILEGROWTH = 1024KB ) TO Filegroup [Part_Before2015]
    Alter Database [Test] Add FILE ( NAME = N'Part_201501', FILENAME = N'...\Part_201501.ndf' , SIZE = 5120KB , FILEGROWTH = 1024KB ) TO Filegroup [Part_201501]
    Alter Database [Test] Add FILE ( NAME = N'Part_201504', FILENAME = N'...\Part_201504.ndf' , SIZE = 5120KB , FILEGROWTH = 1024KB ) TO Filegroup [Part_201504]
    
  • 在datetime2类型(或日期甚至日期时间)上创建分区函数:

    Create Partition Function RangePartFunction (datetime2)
    as Range Right For Values ('20150101', '20150401') 
    
  • 使用每个文件组(N + 1)上的分区函数创建分区方案:

    Create Partition Scheme RangePartScheme as Partition RangePartFunction
    To ([Part_Before2015], [Part_201501], [Part_201504])
    
  • 在其分区方案上创建分区表:

    Create TABLE [PartitionTable] (id int identity(0, 1) not null, date datetime2 not null, text char(8000))
    On RangePartScheme (date) ;
    
  • 在分区列和分区方案上添加聚簇索引:

    Create Clustered Index IDX_Part On dbo.PartitionTable(date) 
        On RangePartScheme (date);
    
  • 将PK添加到id列:

    Alter Table dbo.PartitionTable Add COntraint PK_Part Primary Key Nonclustered(id, date);
    
  

构建用于在右边界之后添加额外文件组并分割最后一个分区的查询

  • 查看分区方案扩展和分区功能拆分
  • 查看使用的DMV
  • 查看所有这些以及如何使用它来创建动态SQL

    Declare @currentDate datetime2
    Declare @endDate datetime2 = '20160701' -- new end date
    Declare @dateAdd int = 3 -- Add 3 month = 1 Quarter
    
    -- Get Current boundaries 
    Select @currentDate = DATEADD(MONTH, @dateAdd,Cast(MAX(value) as datetime2)) From sys.partition_range_values as r
        Inner Join sys.partition_functions as f on r.function_id = f.function_id
    Where f.name = 'RangePartFunction'
    
    -- Get all quarters between max and end date
    ; with d(id, date, name) as (
        Select 0, @currentDate, Convert(char(6), @currentDate, 112)
        Union All
        Select id+1, DATEADD(MONTH, @dateAdd, date), Convert(char(6), DATEADD(MONTH, @dateAdd, date), 112)
        From d Where d.date <= @endDate
    )
    Select * From (
        Select id = id*10, query = 'If Not Exists(Select 1 From sys.filegroups Where name = ''Part_'+name+''')
            Begin 
                Print ''Create Filegroup [Part_'+name+']''
                Alter Database [Test] Add Filegroup [Part_'+name+']
            End
            GO'
        From d
        Union All
        Select id*10+1, 'If Not Exists(Select 1 From sys.sysfiles Where name = ''Part_'+name+''')
            Begin 
                Print ''Create File [Part_'+name+'.ndf]''
                Alter Database [Test] Add FILE ( NAME = N''Part_'+name+''', FILENAME = N''C:\DB\MSSQL11.MSSQLSERVER\MSSQL\DATA\Part_'+name+'.ndf'' , SIZE = 5120KB , FILEGROWTH = 1024KB ) TO Filegroup [Part_'+name+']
            End
            GO'
        From d
        Union All
        Select id*10+2, 'Print ''Add Range [Part_'+name+']''
            Alter Partition Scheme RangePartScheme Next Used [Part_'+name+']
            Go'
        From d
        Union All
        Select id*10+3, 'Print ''Split Function ['+Convert(char(8), date, 112)+']''
            Alter Partition Function RangePartFunction() Split Range ('''+Convert(char(8), date, 112)+''');
            Go'
        From d
    ) as q order by id
    

此查询的输出是必须按顺序运行的SQL查询列表。

  

执行动态SQL

  • 可以手动执行(在SSMS中复制和过去)
  • 可以在while循环中执行,也可以使用游标执行,该游标将逐个执行输出表的每一行(使用sp_executesql)
  

自动化

  • 创建一个执行SQL查询的SQL Server作业:运行用于创建动态SQL的查询,将其输出保存到表变量,然后使用循环/游标执行每个语句

如果您想每月运行一次,并确保始终创建接下来的12个月,请使用此Set @endDate = DATEADD(MONTH, 12, getdate())

  

最后

  • 它将为函数的最后一个边界和@endDate之间的N个缺失区域输出4 * N行:

    • 创建文件组
    • 在文件组上创建文件
    • 扩展分区Scheme的范围
    • 拆分分区功能的范围
  • 您可以使用光标或while循环逐行运行它,也可以将其复制并粘贴到SMSS中。

  • 它也可以通过工作自动化,即。 @endDate = DATEADD(MONTH, 3, getdate()将创建接下来的3个月
  • 如果您需要每月分区,请将@dateAdd更改为1
  • 添加自己的列或检查
  

链接

创建工作= https://www.mssqltips.com/sqlservertip/3052/simple-way-to-create-a-sql-server-job-using-tsql/

sp_executesql = https://technet.microsoft.com/en-us/library/ms188001%28v=sql.110%29.aspx

while loop = https://dba.stackexchange.com/questions/57933/can-exec-work-with-while-loop-of-cursor