我想编写一个动态sql查询,以查找表中每列的缺失值计数。该表由40列组成,每列的遗漏计数很长,因此我们可以动态地做到这一点吗?我尝试按照下面提供的方法编写动态查询,但出现错误
必须声明标量变量“ @sql”
查询:
Declare @sql nvarchar(max)
Declare @columnlist nvarchar(max)
Declare @FieldName nvarchar(max)
set @columnlist = 'Column 1,Column2 ,Column3 ,Column4 ,Column5 ,Column6 ,Column7 ,Column8 ,Column9 ,Column10 ,Column11 ,Column12,Column13'
set @FieldName = 'Column 1,Column2 ,Column3 ,Column4 ,Column5 ,Column6 ,Column7 ,Column8 ,Column9 ,Column10 ,Column11 ,Column12,Column13'
set @sql = 'SELECT COUNT(*)-COUNT(' + @columnlist + ') as '+ @FieldName +'from table_name'
exec (@sql)
答案 0 :(得分:2)
尝试一下:
DECLARE @sql nvarchar(max) = N'SELECT';
DECLARE @table_name nvarchar(256) = N'YourTableName'
SELECT @sql = @sql + ' COUNT(*)-COUNT(' + QUOTENAME(COLUMN_NAME) + ') as '+ QUOTENAME(COLUMN_NAME) + N','
FROM INFORMATION_SCHEMA.COLUMNS
WHERE TABLE_SCHEMA = N'dbo'
AND TABLE_NAME = @table_name
SET @sql = LEFT(@sql, LEN(@sql) - 1) + ' from ' + @table_name
EXEC (@sql)
已添加
好吧,所以这是一个示例,说明如何使用相似的方式为每一列计算至少有一个重复项的值的数量:
DECLARE @sql nvarchar(max) = N'WITH duplicates AS (SELECT';
DECLARE @table_name nvarchar(256) = N'YourTableName';
SELECT @sql = @sql
+ N' CASE WHEN COUNT(' + QUOTENAME(COLUMN_NAME)
+ N') OVER (PARTITION BY ' + QUOTENAME(COLUMN_NAME)
+ N') > 1 THEN ' + QUOTENAME(COLUMN_NAME)
+ N' END as '+ QUOTENAME(COLUMN_NAME) + N','
FROM INFORMATION_SCHEMA.COLUMNS
WHERE TABLE_SCHEMA = N'dbo'
AND TABLE_NAME = @table_name;
SET @sql = LEFT(@sql, LEN(@sql) - 1) + ' from ' + @table_name + ') SELECT';
SELECT @sql = @sql
+ N' COUNT(DISTINCT ' + QUOTENAME(COLUMN_NAME)
+ N') as '+ QUOTENAME(COLUMN_NAME) + N','
FROM INFORMATION_SCHEMA.COLUMNS
WHERE TABLE_SCHEMA = N'dbo'
AND TABLE_NAME = @table_name;
SET @sql = LEFT(@sql, LEN(@sql) - 1) + ' from duplicates';
EXEC (@sql);
您看到它使用了2条SELECT语句,第一个创建了一个CTE,该CTE将所有没有重复的值替换为NULL:
CASE WHEN COUNT([C1]) OVER (PARTITION BY [C1]) > 1 THEN [C1] END as [C1]
第二个使用COUNT DISTINCT计数剩余的内容。这样,将不计算NULL值。
答案 1 :(得分:0)
尝试一下
dotnet run