使用oledb导入Csv文件 - 不读取" 1.2.3.4"值

时间:2016-09-28 06:53:01

标签: c# csv oledb

我希望使用oledb连接将csv文件导入数据库到c#。我的csv文件在这一列中有9列是"版本号"当我将csv文件数据加载到datatable时,它将该值转换为" 1.234"。我想" 1.2.3.4"值保存到数据库中。我试图将列数据类型更改为文本到csv但仍然可以转换。需要对此提出建议,我该如何解决这个问题。

 OleDbConnectionStringBuilder connectionString = new OleDbConnectionStringBuilder();
        connectionString.Provider = "Microsoft.ACE.OLEDB.12.0";
        if (extension == ".csv")
        {
            connectionString["Extended Properties"] = "text;HDR=Yes;";
            connectionString.DataSource = Path.GetDirectoryName(fileName);
            tableName = Path.GetFileName(fileName);
        }
        else
            if (extension == ".xls")
            {
                connectionString["Extended Properties"] = "Excel 8.0;HDR=Yes;IMEX=1";
                connectionString.DataSource = fileName;
            }
            else
                if (extension == ".xlsx")
                {
                    connectionString["Extended Properties"] = "Excel 12.0 Xml;HDR=YES";
                    connectionString.DataSource = fileName;
                }
OleDbDataAdapter oleda = new OleDbDataAdapter("select * from [{1}]", fileName), 
                   connectionString.ToString());
DataTable dtbCSV = new DataTable();
oleda.Fill(dtbCSV);

Csv文件数据:

Name                    Policy Category VersionName        ReleaseDate  Description                      DownloadType   Version     FileUrl
What's_New_Release_8.1  Trial       What's_New_Release_8.1  9/1/2016    This is the Description for Downloads   Sku      1.1        https://google.com/image/temp.png
Release 7 0 What's New  Trial       Release 7 0 What's New  10/5/2016   This is the Description for Downloads   Sku      1.23.41.2  http://google.com/image/temp.png

Schema.ini文件:

[6770aedf-e6b7-44de-afbf-8380f5c450ca.csv] 
 ColNameHeader=True 
 Format=CSVDelimited 
 Col1=Name Text Width 500 
 Col2=Policy Text Width 1000
 Col3=Category Text Width 1000 
 Col4=VersionName Text Width 1000
 Col5=ReleaseDate DateTime
 Col6=Description Text Width 1000
 Col7=DownloadType Text Width 1000
 Col8=Version DateTime
 Col9=FileUrl Text Width 1000

这是我的schema.ini,它位于我保存csv文件的临时文件夹中

先谢谢,

2 个答案:

答案 0 :(得分:2)

好吧,首先我假设你的csv文件是制表符分隔的。 您需要的是指定OleDb的列类型以正确解析它。我认为最好的方法是使用schema.ini文件,该文件必须与csv文件所在的路径相同。这是它应该如何显示的示例:

[test.csv]
Format=TabDelimited
ColNameHeader=false
MaxScanRows=0
Col1=Name Text
Col2=Policy Text
Col3=VersionName Text
Col4=ReleaseDate Text
Col5=Description Text
Col6=DownloadType Text
Col7=Version Text
Col8=FileUrl Text

如您所见,在第一行中您必须指定您的csv文件名。然后我将分隔符设置为制表符。之后,我停用第一行是标题行(这将导致您删除csv中的第一行)。之后,您必须使用预期类型定义所有列。

希望这有帮助。

答案 1 :(得分:0)

@Pikoh已经解释了如何使用schema.ini文件来控制驱动程序处理每个字段的人。

另一种选择是使用像CsvHelper这样的库来读取将CSV数据直接映射到对象,例如:

var csv = new CsvReader( textReader );
IEnumerable<MyClass> records = csv.GetRecords<MyClass>();

GetRecords返回一个IEnumerable,这意味着行加载你可以使用LINQ过滤它们或只加载特定的字段:

var records = from record in csv.GetRecords<MyClass>()
              where record.ReleseDate > new DateTime(2016,09,01)
              select new {record.Name};

可以自动映射字段,也可以使用流畅的界面指定自己的映射。映射类还允许您指定本地化选项,例如处理MM/DD/YYYY vs DD/MM/YYYY格式:

public sealed class MyClassMap : CsvClassMap<MyClass>
{
    public MyClassMap()
    {
        Map( m => m.Description ).Index( 0 )
                           .TypeConverterOption( CultureInfo.InvariantCulture );
        Map( m => m.TimeStamp ).Index( 1 )
                          .TypeConverterOption( DateTimeStyles.AdjustToUniversal );
        Map( m => m.Cost ).Index( 2 )
                          .TypeConverterOption( NumberStyles.Currency );
        Map( m => m.CurrencyFormat ).Index( 3 )
                          .TypeConverterOption( "C" );
        Map( m => m.BooleanValue ).Index( 4 )
                          .TypeConverterOption( true, "sure" )
                          .TypeConverterOption( false, "nope" );
    }
}

最后,您可以避免安装正确的OLEDB驱动程序(x86或x64)的麻烦。