我是SSIS和C#的新手。在SQL Server 2008中,我从.csv文件导入数据。现在我有了动态列。它们可以是大约22列(有些时候或多或少)。我创建了一个包含25列的临时表,并将数据导入其中。本质上,我导入的每个平面文件都有不同的列数。它们都只是格式正确。我的任务是从包含标题的.csv平面文件中导入所有行。我想把它放在一个工作中,这样我就可以每天将多个文件导入到表中。
因此,对于每个循环,我有一个数据流任务,我有一个脚本组件。我在下面用C#代码(在线研究),但我得到错误:
索引超出了数组的范围。
我试图使用MessageBox找到原因,我发现它正在读取第一行,并且索引超出了第一行之后的数组范围。
1。)我需要你帮助修复代码
2.。)我的File1Conn是平面文件连接,而不是我想直接从我的foreach循环不断更新的变量 User :: FileName 中读取它。请帮助修改下面的代码。
提前致谢。
这是我的平面文件:
https://drive.google.com/file/d/0B418ObdiVnEIRnlsZFdwYTRfTFU/view?usp=sharing
using System;
using System.Data;
using Microsoft.SqlServer.Dts.Pipeline.Wrapper;
using Microsoft.SqlServer.Dts.Runtime.Wrapper;
using System.Windows.Forms;
using System.IO;
[Microsoft.SqlServer.Dts.Pipeline.SSISScriptComponentEntryPointAttribute]
public class ScriptMain : UserComponent
{
private StreamReader SR;
private string File1;
public override void AcquireConnections(object Transaction)
{
// Get the connection for File1
IDTSConnectionManager100 CM = this.Connections.File1Conn;
File1 = (string)CM.AcquireConnection(null);
}
public override void PreExecute()
{
base.PreExecute();
SR = new StreamReader(File1);
}
public override void PostExecute()
{
base.PostExecute();
SR.Close();
}
public override void CreateNewOutputRows()
{
// Declare variables
string nextLine;
string[] columns;
char[] delimiters;
int Col4Count;
String[] Col4Value = new string[50];
// Set the delimiter
delimiters = ";".ToCharArray();
// Read the first line (header)
nextLine = SR.ReadLine();
// Split the line into columns
columns = nextLine.Split(delimiters);
// Find out how many Col3 there are in the file
Col4Count = columns.Length - 3;
//MessageBox.Show(Col4Count.ToString());
// Read the second line and loop until the end of the file
nextLine = SR.ReadLine();
while (nextLine != null)
{
// Split the line into columns
columns = nextLine.Split(delimiters);
{
// Add a row
File1OutputBuffer.AddRow();
// Set the values of the Script Component output according to the file content
File1OutputBuffer.SampleID = columns[0];
File1OutputBuffer.RepNumber = columns[1];
File1OutputBuffer.Product = columns[2];
File1OutputBuffer.Col1 = columns[3];
File1OutputBuffer.Col2 = columns[4];
File1OutputBuffer.Col3 = columns[5];
File1OutputBuffer.Col4 = columns[6];
File1OutputBuffer.Col5 = columns[7];
File1OutputBuffer.Col6 = columns[8];
File1OutputBuffer.Col7 = columns[9];
File1OutputBuffer.Col8 = columns[10];
File1OutputBuffer.Col9 = columns[11];
File1OutputBuffer.Col10 = columns[12];
File1OutputBuffer.Col11 = columns[13];
File1OutputBuffer.Col12 = columns[14];
File1OutputBuffer.Col13 = columns[15];
File1OutputBuffer.Col14 = columns[16];
File1OutputBuffer.Col15 = columns[17];
File1OutputBuffer.Col16 = columns[18];
}
// Read the next line
nextLine = SR.ReadLine();
}
}
}
答案 0 :(得分:0)
正如您所提到的,文件具有动态数量的列,您需要在脚本组件中按分隔符计算列数,然后重定向到不同的输出。
对于第二个问题,您可以将变量分配给平面文件连接管理器连接字符串属性。然后,您可以直接在脚本中读取变量值。
除脚本组件外,您可以使用虚拟分隔符创建“一列”平面文件源,然后在数据流任务中,您可以将列数量读入变量,条件分割数据流,重定向输出到不同的目的地。可以在http://sqlcodespace.blogspot.com.au/2015/03/ssis-design-pattern-handling-flat-file.html
找到一个示例