如何从所有表/列中删除所有新行字符

时间:2017-01-20 21:58:44

标签: sql-server ssis snowflake-datawarehouse

我正在努力将数据库从SQL Server导出到Snowflake,我遇到了一个问题,即我们拥有和未知数量的列具有用户注释并且其中包含新的行字符。问题是数据库有超过280个表,我不想手动遍历每个表。我想知道是否有办法自动化这个。

我目前正在使用SSIS导出数据,只是在我找到的具有换行符的列上执行select替换。

我也使用过这个脚本:

declare @NewLine char(2) set @NewLine=char(13)+char(10) update Projects set [PR_ITComment] =Replace([PR_ITComment] , @NewLine,'') WHERE [PR_ITComment] like '%' +@NewLine +'%'

4 个答案:

答案 0 :(得分:1)

这是解决这个问题的一种方法。这利用了动态sql,因此您不必诉诸循环。您可能需要稍微调整一下以满足您的需求。您可以添加另一个谓词来阻止某些表或列表中的那类事物。这种方式的工作方式是创建大量的更新语句。然后你只需执行大量的字符串。

declare @SQL nvarchar(max) = ''

select @SQL = @SQL + 'Update ' + quotename(t.name) + ' set ' + quotename(c.name) + ' = replace(Replace(' + quotename(c.name) + ', char(10), ''''), char(13), '''');' 
from sys.tables t
join sys.columns c on c.object_id = t.object_id
join sys.systypes st on st.xtype = c.system_type_id
where st.name in ('text', 'ntext', 'varchar', 'nvarchar', 'char', 'nchar')

select @SQL

--Once you are comfortable with the output you can uncomment the line below to actually run this.
--exec sp_executesql @SQL

答案 1 :(得分:0)

这与Sean Lange的答案类似,但它解析为每个表一次更新,而不是每列一次更新。

--declare @schema nvarchar(256) = 'dbo';
--declare @table  nvarchar(256) = 'table';
declare @sql    nvarchar(max) = '';

  set @sql += (select 'update '+t.table_schema+'.'+t.table_name+' set ' +stuff(
    ( select ', ['+i.column_name +']=replace(replace(['+i.column_name+'],char(10),''''),char(13),'''')'+char(10) 
        from information_schema.columns i 
        where i.table_schema=t.table_schema 
          and i.table_name=t.table_name 
          and i.data_type in ('char','nchar','varchar','nvarchar','text','ntext') 
        order by i.ordinal_position 
        for xml path('')),1,1,'')+';'+char(10)
    from information_schema.tables t
    where t.table_type='base table' 
      --and t.table_schema = @schema
      --and t.table_name   = @table
    for xml path (''), type).value('.','varchar(max)')

  --print @sql
  select @sql
  --exec sp_executesql @sql

答案 2 :(得分:0)

如果您能够使用引号(这是标准的CSV方式)导出数据,Snowflake可以使用新行简单地加载数据。你也可以使用转义,但引用更好。

包含3行的示例文件

$ cat data.csv
1,"a",b
2,c,"d1
d2"
3,"e1,e2,
e3",f

示例SQL和输出:

create or replace table x(nr int, a string, b string);
put file://data.csv @%x;
copy into x file_format = (field_optionally_enclosed_by = '"');
select * from x;
----+--------+----+
 NR |   A    | B  |
----+--------+----+
 1  | a      | b  |
 2  | c      | d1 |
    |        | d2 |
 3  | e1,e2, | f  |
    | e3     |    |
----+--------+----+

答案 3 :(得分:0)

将数据导出到Excel时遇到了同样的问题。 您可以使用''替换char(13)和char(10)。那可行。

在您的" Execure SQL"中进行简单替换。任务查询或SSIS的SP。或者您可以在update语句中使用它来永久更新记录。