将T-SQL语句解析为标记

时间:2015-05-26 08:03:49

标签: c# .net sql-server tsql parsing

您可以看到here代码语句解析为令牌的C#有多好。例如,以下代码:

namespace MyNamespace
{
    class MyClass
    {
        public void MyFunction(int arg1)
        {
            int var1 = arg1;
        }
    }
}

被解析为:

enter image description here

我想做类似的事情,而是用T-SQL语句代替。例如,如果我有以下T-SQL语句:

IIF(COALESCE([Col001], [Col002], [Col003]) > [Col004], [Col005] * [Col006] + ISNULL([Col007], [Col008]), CONCAT(SUBSTRING([Col009], 0, 3), 'sample text', [Col010]))

会给我这样的东西:

IIF, COALESCE, ISNULL, CONCAT, SUBSTRING    - functions 
[Col001], [Col002], ... , [Col010]          - columns 
0, 3, 'sample text'                         - variables

或者如果我有:

ISNULL([Col001], [Col002], [Col003])

有错误的结构:

[The isnull function requires 2 argument(s).] - error

没有任何免费或付费的最新解决方案,似乎使用Microsoft解析器是最好的解决方案。正如我所读,我需要使用Microsoft.SqlServer.Management.SqlParser.Parser命名空间,但没有任何示例,我无法按照我喜欢的方式拆分T-SQL语句。此外,它似乎只适用于完整的语句(例如,您需要SELECT子句,我只需要将它用于代码片段。)

我可以使用此命名空间执行此操作,还是最好根据我的需要开始编写C#类?

1 个答案:

答案 0 :(得分:11)

我必须在csproj中手动添加引用

  

Microsoft.SqlServer.Management.SqlParser,Version = 12.0.0.0,Culture = neutral,PublicKeyToken = 89845dcd8080cc91

<Reference Include="Microsoft.SqlServer.Management.SqlParser, Version=12.0.0.0, Culture=neutral, PublicKeyToken=89845dcd8080cc91" />

一个简单的例子:

string sql = "IIF(COALESCE([Col001], [Col002], [Col003]) > [Col004], [Col005] * [Col006] + ISNULL([Col007], [Col008]), CONCAT(SUBSTRING([Col009], 0, 3), 'sample text', [Col010]))";

var po = new ParseOptions { };
var scanner = new Scanner(po);
scanner.SetSource(sql, 0);

Tokens token;
int state = 0;
int start;
int end;
bool isPairMatch;
bool isExecAutoParamHelp;

while ((token = (Tokens)scanner.GetNext(ref state, out start, out end, out isPairMatch, out isExecAutoParamHelp)) != Tokens.EOF)
{
    string str = sql.Substring(start, end - start + 1);
    Console.WriteLine("{0}: {1}", token, str);
}

取自http://www.sqlservercentral.com/blogs/dave_ballantynes_blog/2012/03/13/parsing-t-sql-the-easy-way/

取自Parsing T-SQL – The easy way

请注意,此解析器可识别一定数量的函数(例如IIFCOALESCE,...)。无法识别的函数只是标记为TOKEN_ID,就像列名一样。