我正在尝试使用SSIS将JSON文件导入我的数据库。 由于我在SQL Server 2016上,我可以将文件放在一行中并使用OPENJSON读取它们。
我的问题是不想只引入JSON文本。我还想从文件名和当前目录中获取一些信息。
我的脚本组件如下所示:
public override void Input0_ProcessInputRow(Input0Buffer Row)
{
string type = "NA";
string ChassisSN = "NA";
string CartridgeSN = "NA";
string filepath = Variables.File;
string filename = Path.GetFileNameWithoutExtension(filepath);
string filenamefull = Path.GetFileName(filepath);
string Parent = new DirectoryInfo(Path.GetDirectoryName(filepath)).Name;
Char splitDelim = '_';
String[] FileNameSplit = filename.Split(splitDelim);
String[] ParentSplit = Parent.Split(splitDelim);
CartridgeSN = FileNameSplit[2];
ChassisSN = ParentSplit[2];
type = FileNameSplit[3];
if (ChassisSN != oldChassisSN)
{
oldChassisSN = ChassisSN;
}
Output0Buffer.AddRow();
Output0Buffer.Filename = filenamefull.Trim();
Output0Buffer.ChassisSN = ChassisSN.Trim();
Output0Buffer.CartridgeSN = CartridgeSN.Trim();
Output0Buffer.Type = type.Trim();
Output0Buffer.JSON = Row.Column0.ToString;
}
我的问题是,当我尝试将JSON数据放回到新列时,它说它只读取,因为我选择了文本流数据类型。由于文件很大,这些字符很可能会超过4000个。
我还尝试同时执行平面文件源和脚本作为源并合并数据,但不断出现在不同的行上。
它循环的每个文件只产生一行数据,这些数据可以在我的代码中看到。那么如何才能获得我需要的所有信息呢?
答案 0 :(得分:0)
有点晚了,但可能仍与其他人寻找该问题的答案有关。
将输出列定义为DT_(N)TEXT
时,它会从值类型变为BlobColumn对象,并且不能直接分配其值。相反,应该使用AddBlobData()
方法来提供一个值:
MainBuffer.AddRow();
MainBuffer.Id = item.Id;
MainBuffer.LargeCol.AddBlobData(Encoding.UTF8.GetBytes(item.JsonData));