是SSIS Custom Component的新手。刚开始编写一个组件,其中输入行计数永远不会与输出行计数相同。 foreach输入行它会进行一些验证,并生成需要映射到输出缓冲区的n行。
因此,在设计时间验证编码之后,一切都很好。
我的RunTime代码如下:
public override void PreExecute()
{
IDTSInput100 input = ComponentMetaData.InputCollection[0];
inputBufferColumnIndex = new int[input.InputColumnCollection.Count];
for (int x = 0; x < input.InputColumnCollection.Count; x++)
{
IDTSInputColumn100 column = input.InputColumnCollection[x];
inputBufferColumnIndex[x] = BufferManager.FindColumnByLineageID (input.Buffer, column.LineageID);
}
IDTSOutput100 output = ComponentMetaData.OutputCollection[0];
outputBufferColumnIndex = new int[output.OutputColumnCollection.Count];
for (int x = 0; x < output.OutputColumnCollection.Count; x++)
{
IDTSOutputColumn100 outcol = output.OutputColumnCollection[x];
outputBufferColumnIndex[x] = BufferManager.FindColumnByLineageID(input.Buffer, outcol.LineageID);
}
}
public override void ProcessInput(int inputID, PipelineBuffer buffer)
{
if(!buffer.EndOfRowset)
{
while (buffer.NextRow())
{
var rec = new Record
{
Source = buffer[0].ToString(),
Nk = buffer[1].ToString(),
Guid = new Guid(buffer[2].ToString()),
FromDate = Convert.ToDateTime(buffer[3].ToString()),
ToDate = Convert.ToDateTime(buffer[4].ToString())
};
sourceRecords.Add(rec);
}
ProcessArray(sourceRecords,buffer);
}
}
public void ProcessArray(List<Record> records, PipelineBuffer buffer)
{
//Get Distinct NKs from the source Records
List<string> nKs = (from c in records select c.Nk).Distinct().ToList();
foreach (var nk in nKs)
{
//Get all the record for particular NK
List<Record> filteredRecords = (from c in sourceRecords where c.Nk == nk select c)
.OrderBy(c => c.Source)
.ThenBy(c => c.FromDate)
.ThenBy(c => c.ToDate).ToList();
foreach (var filteredRecord in filteredRecords)
{
_start = filteredRecord.FromDate;
_end = filteredRecord.ToDate;
while (filteredRecord.WriteComplete == false)
{
foreach (var record in filteredRecords)
{
if (record.FromDate > _start && record.FromDate < _end) _end = record.ToDate;
if (record.ToDate < _end && record.ToDate > _start) _end = record.ToDate;
}
//Output0Buffer.AddRow();
//Output0Buffer.outSource = filteredRecord.Source;
//Output0Buffer.outNK = filteredRecord.Nk;
//Output0Buffer.outRecid = filteredRecord.Guid;
//Output0Buffer.outFromDate = _start;
//Output0Buffer.outToDate = _end;
buffer.SetString(5,filteredRecord.Source);
buffer.SetString(6,filteredRecord.Nk);
buffer.SetGuid(7,filteredRecord.Guid);
buffer.SetDateTime(8,filteredRecord.FromDate);
buffer.SetDateTime(9,filteredRecord.ToDate);
_start = _end;
_end = filteredRecord.ToDate;
if (_start == _end) filteredRecord.WriteComplete = true;
}
}
}
}
}
public class Record
{
public Guid Guid { get; set; }
public string Nk { get; set; }
public string Source { get; set; }
public DateTime FromDate { get; set; }
public DateTime ToDate { get; set; }
public bool WriteComplete { get; set; }
}
在我的ProcessArray方法中尝试填充输出缓冲区。我甚至不确定这可以做到。
任何指导都将不胜感激。
由于
答案 0 :(得分:0)
是的,这种类型的转换可以完成,它被称为异步转换。你的代码看起来不错。如果你遇到特定的问题,你的问题就不清楚了。
您可能想尝试创建一个异步脚本组件转换,这样您就不必摸索所有SSIS管道。
答案 1 :(得分:0)
我不确定我是否理解您要实现的目标,但看起来您正在尝试对所有数据进行排序,然后按顺序处理已排序的列表。请注意,您的ProcessInput方法被多次调用,每个方法都有一个新的缓冲区。使用接收缓冲区执行的任何排序仅适用于此特定缓冲区 - 数据未全局排序,因此结果可能会因缓冲区边界而异。
特殊情况可以吗?如果没有,请使用Sort变换为您排序所有数据,在Sort之后添加变换并逐行处理数据 - 它已经排序。所以只需逐行读取它,然后在读取后修改当前行 - 这就是buffer.SetString的用途。
另外,不要硬编码列indix,比如buffer.SetString(5,...) - 数字可能会改变,最好在PreExecute中获取并保存列索引,然后使用像 buffer.SetString(nkColumnIndex,nkColumnValue);