在SSIS中如何将BlobColumn解析为单词,同时删除空格和回车?

时间:2015-02-21 22:26:59

标签: c# sql-server ssis script-component

我在SSIS中创建了一个数据流,它获取文本文件的内容并将其作为BlobColumn上传到我的SQL Server数据库表中。文本文件是包含句子,回车和换行的文档。我有一个执行SQL转换,加载文件如下:

 Use MyDB;
 Create Table TextToToken(Filename nvarchar(60), FileType nvarchar(60), Document varbinary(max));
 Go

 Insert into TextToToken(Filename, FileType, Document)
 Select 'TokenDoc1.txt' as Filename, '*.txt' as FileType,  
 * from OPENROWSET(BULK N'C:\Docs\Doc1.txt', SINGLE_BLOB) as Document
 Go

我创建了一个读取Document BlobColumn的脚本组件,我尝试使用以下内容解析用逗号分隔的单词:

 public override void Input0_ProcessInputRow(Input0Buffer Row)
{
    string[] words = BlobToString(Row);
}
private string BlobToString(BlobColumn blob)
{
    string result = "";
    try
    {
        if (blob != null)
        {
            result = System.Text.Encoding.Unicode.GetString(blob.GetBlobData(0, Convert.ToInt32(blob.Length)));
        }
    }
    catch (Exception ex)
    {
        result = ex.Message;
    }
    return result;
}

除了逗号之外,我如何扩充以上内容以基于句点,空格和回车换行来分隔单词?

0 个答案:

没有答案