从SQL的级联拖车记录中删除回车和换行?

时间:2019-06-06 15:33:40

标签: sql-server tsql replace notepad

我有一个从SSMS中运行的SQL查询得到的结果数据集,其中包括1行预告片记录,该记录以.txt格式导出并保存到记事本。但是,预告片记录自动包含十六进制控制,以在作为预告片记录的串联字段(750个字符)之后包含换行/运输记录。在导出为.txt格式之前,如何从预告片记录的末尾消除此错误?文件中不得包含任何空行。

我已经在SELECT语句中为我的预告片记录尝试了以下行代码,这似乎是针对这种情况的常见解决方法:

REPLACE(REPLACE('T'+CAST(RIGHT(REPLACE(STR(COUNT(*)),' ','0'),9) AS VARCHAR)+SPACE(740),CHAR(10),''),CHAR(13),'')

但是,在以.txt格式导出时,它仍然包含换行和回车符。

REPLACE(REPLACE('T'+CAST(RIGHT(REPLACE(STR(COUNT(*)),' ','0'),9) AS VARCHAR)+SPACE(740),CHAR(10),''),CHAR(13),'')

预期结果是文件不包含导出文档的随附十六进制视图中显示的0D和0A字节字符。

HEX VIEW OF EXPORTED .TXT FILE

3 个答案:

答案 0 :(得分:0)

当您选择“将结果另存为”并选择“文本文件”时,结果是制表符分隔的文本文件。每个字段用制表符分隔,每个记录用CR / LF终止。无法通过更改查询来更改它。

enter image description here

生成的文本文件如下:

enter image description here 该文件以字节顺序标记EF BB BF开头,表示它为UTF-8格式。 78、79和7A是“ x”,“ y”和“ z”。这些用TAB(09)分隔,并且记录以CR / LF(OD / OA)终止。然后第二条记录也是如此,同样由CR / LF终止。

另一方面,您可以选择“复制”,运行“记事本”和“粘贴”文本。您将在记录之间获得CR / LF,但最后没有。

enter image description here

答案 1 :(得分:0)

创建文本文件时,我无法从您所说的内容(以及以下注释)中判断问题出在SQL级别还是外部。无论哪种方式,您都可以使用NGrams8K来解决此问题(链接还包括VARCHAR(MAX)版本,该版本比8K版本慢,但仍然令人讨厌。)

我通常会自动执行手动更新构建脚本的过程,方法是通过OPENROWSET(或其他方式)将其导入,然后修改文本,然后将结果写入新文件,以替换旧文件(使用BCP)。下面是一些代码,可以帮助您了解如何使用NGrams函数来解决此问题。

分析:

DECLARE @someString VARCHAR(8000) =
'blah blah blah.... ;
blah blah     .... ;
blah blah blah.... ;
 ...;';

SELECT
  ng.position,
  ng.token,
  charValue   = ASCII(ng.Token),
  binaryValue = CAST(ng.token AS VARBINARY(2))
FROM samd.NGrams8K(@someString,1) AS ng;

返回值(为简洁起见,被截断):

position             token     charValue   binaryValue
-------------------- --------- ----------- -----------
1                    b         98          0x62
2                    l         108         0x6C
3                    a         97          0x61
4                    h         104         0x68
5                              32          0x20
6                    b         98          0x62
...
...
68                   .         46          0x2E
69                   .         46          0x2E
70                   .         46          0x2E
71                             32          0x20
72                   ;         59          0x3B
73                             13          0x0D
74                             10          0x0A
75                             32          0x20
76                             32          0x20
....

请注意第73和74行?这些是您要删除的两个字符:CHAR(13)和CHAR(10)又称为 0D 0A 。您要删除那些。

使用NGrams或NGrams8k,可以通过找到最后一个CHAR(13)来获取最后一个LF + CR的位置。

DECLARE @someString VARCHAR(8000) =
'blah blah blah.... ;
blah blah     .... ;
blah blah blah.... ;
 ...;';

SELECT MAX(ng.position)
FROM   samd.NGrams8K(@someString,1) AS ng
WHERE  ASCII(ng.Token) = 13;

返回: 73

请注意,我正在使用变量(@someString)进行演示,如果GUI要添加最终的LF / CR,则必须导入该文件并将内容分配给变量。

DECLARE @someString VARCHAR(8000) =
'blah blah blah.... ;
blah blah     .... ;
blah blah blah.... ;
 ...;';

-- Use STUFF to remove the last CHAR(13)+CHAR(10)
DECLARE @newString VARCHAR(8000) = 
STUFF(
  @someString,
  (
    SELECT MAX(ng.position)
    FROM   samd.Ngrams8K(@someString,1) AS ng
    WHERE  ASCII(ng.Token) = 13
  ),2,'');

此代码^^^^删除了最终的LF / CR。

更新:

我刚刚看到大卫的回应;如果是这种情况,您可以使用我的解决方案来拉入文件,更改内容并写入新文件。以下是我如何执行此操作的示例(虽然不完美,但有效)。

CREATE PROC dbo.FileTransform_clean
  @sourceFile NVARCHAR(500),
  @destFile   NVARCHAR(500),
  @badText    NVARCHAR(1000),
  @cleanup    BIT = 1
AS
BEGIN
  -- 0. Prep
  BEGIN
    SET NOCOUNT ON;
    SET @sourceFile = TRIM(@sourceFile);

    DECLARE @pos  SMALLINT       = CHARINDEX('\',REVERSE(@sourceFile));
    DECLARE @path NVARCHAR(4000) = SUBSTRING(@sourceFile,1,LEN(@sourceFile)-@pos),
            @file NVARCHAR(4000) = SUBSTRING(@sourceFile,LEN(@sourceFile)-@pos+2,4000);
    DECLARE @t TABLE (subdirectory NVARCHAR(4000), depth TINYINT, [file] BIT);

    INSERT @t(subdirectory, depth, [file])
      EXEC [master].dbo.xp_DirTree @path,1,1;

    IF NOT EXISTS (SELECT 1 FROM @t AS t WHERE t.subdirectory = @file)
    BEGIN
      DECLARE @error VARCHAR(100) = 
        'The source file, '+ISNULL(@sourceFile,'NULL')+' was not found.';
      PRINT @error;
      GOTO error
    END

    IF OBJECT_ID('tempdb..##import','U') IS NOT NULL DROP TABLE ##import;
    CREATE TABLE ##import(Document VARCHAR(MAX));
  END

  -- 1. File Import
  BEGIN
    PRINT 'Performing file import...';

    DECLARE @SQL NVARCHAR(4000) = 'INSERT INTO ##import(Document)
    SELECT * FROM OPENROWSET (BULK N'''+@sourceFile+''', SINGLE_BLOB) AS Document;';

    EXEC (@SQL);
  END

  -- 2. Transformation
  BEGIN
    PRINT 'Performing file transform...';

    DECLARE @query NVARCHAR(4000) = 
      N'SELECT STRING_AGG(s.item,CHAR(10)) WITHIN GROUP (ORDER BY s.ItemNumber)
        FROM   SQLToolbox_Misc.samd.delimitedSplitAB((SELECT i.Document FROM ##import AS i),CHAR(10)) AS s
        WHERE NOT EXISTS (SELECT 1 FROM STRING_SPLIT('''+@badText+''','','') AS ss 
                  WHERE CHARINDEX(ss.[value],s.item)>0);'

    SET @SQL = 'bcp '+'"'+@query+'" '+'queryout "'+@destFile+'" -c -T -S '+@@SERVERNAME;
    SET @SQL = REPLACE(@sql,CHAR(13)+CHAR(10),'');

    DECLARE @SQLText VARCHAR(8000) = '  Executing:'+CHAR(10)+'  '+@SQL;
    PRINT @SQLText;

    EXEC [master]..xp_cmdshell @SQL;
    IF @cleanup = 1 DROP TABLE ##import;
  END

  error:
END

这段代码所做的事情完全不同,但是您可以留意一下我: 1.使用OPENROWSET拉入文件 2.对内容做一些事情(在我的代码中,我删除了@badText定义的任何“不良文本” 3.使用BCP写入新文件

希望这会有所帮助。

答案 2 :(得分:0)

可能有更好的自动化方法,但是要回答所提出的问题,您可以取消选中Op中找到的“在复制或保存时保留CR / LF”框