C#Winforms-读取csv文件时出现问题

时间:2020-05-04 06:12:15

标签: c# csv streamreader

我看了我能找到的所有csv阅读示例,但我不确定这是哪里出了错。

我对C#还是陌生的,但到目前为止,还是很喜欢!

无论如何,这是在大多数情况下最有效的代码(您可以通过我在阅读中尝试过多种选择的评论看到):

StreamReader sr = new StreamReader(csvFileToImport);
                while (sr.EndOfStream != true)
                {
                    string line = sr.ReadLine();
                //string[] value = line.Split(new string[] { "\",\"" }, StringSplitOptions.None);
                //string[] value = line.Split(new string[] {","}, StringSplitOptions.None);
                //string[] value = line.Split(new string[] { "(?=(?:[^']*'[^']*')*[^']*$)" }, StringSplitOptions.None);
                //string[] value = line.Split(new string[] { "," }, StringSplitOptions.None);
                string[] value = Regex.Split(line, @"\s|[,]");

                StockItem si = new StockItem();
                    switch (stockFile.Supplier)
                    {
                        case "Leader":
                            si.Supplier = stockFile.Supplier;
                            si.Category = value[2].Replace("'", "''");
                            si.StockCode = value[11].Replace("'", "''");
                            si.Cost = Convert.ToDecimal(value[7]);
                            si.Description = value[4].Replace("'", "''");
                            si.Image = value[9].Replace("'", "''");
                            si.Manufacturer = value[10].Replace("'", "''");
                            si.Sell = Convert.ToDecimal(value[8]);
                            si.StockAdelaide = value[17].Replace("'", "''");
                            si.StockBrisbane = value[18].Replace("'", "''");

                            si.StockMelbourne = value[19].Replace("'", "''");
                            si.StockPerth = value[20].Replace("'", "''");
                            si.StockSydney = value[21].Replace("'", "''");
                            si.Subcategory = value[3].Replace("'", "''");

                            //Add line into db
                            string sql = "insert into Stock (Supplier, StockCode, Manufacturer, Category, Subcategory, Description, Cost, Sell, Image, StockPerth, StockAdelaide, StockSydney, StockBrisbane, StockMelbourne) values ('" + si.Supplier + "', '" + si.StockCode + "', '" + si.Manufacturer + "', '" + si.Category + "', '" + si.Subcategory + "', '" + si.Description + "', " + si.Cost + ", " + si.Sell + ", '" + si.Image + "', '" + si.StockPerth + "', '" + si.StockAdelaide + "', '" + si.StockSydney + "', '" + si.StockBrisbane + "', '" + si.StockMelbourne + "')";
                            cmd = new SqlCommand(sql, cn);
                            cmd.ExecuteNonQuery();
                            break;
                        default:
                            break;
                    }
                }
                success = true;
                cn.Close();

我已经链接到1行csv文件,如果有人会这么好看,我将无法正确读取该文件,我将非常感激!

在此先感谢您,也可以随时指出我可以改进的所有常规代码...我相信还有很多地方可以改进。

再次感谢:)

CSV链接:https://www.dropbox.com/s/nnaruu0twds3wrl/csv_error.csv?dl=0

更新:

由于缺乏清晰性而致歉,因为我在读取文件时遇到以下错误:

System.FormatException:'输入字符串的格式不正确。'

该行显示为:

"MECMD4VL2X426,ME,Memory,DDR-4 (Desktop),Corsair Vengeance LPX 8GB (2x4GB) DDR4 2666MHz C16 Desktop Gaming Memory Black,\"Corsair 8GB (2x4GB) DDR4 2666MHz Vengeance LPX Black"

查询数组时,其值显示为:

value[0] "MECMD4VL2X426"
value[1] "ME"
value[2] "Memory"
value[3] "DDR-4"
value[4] "(Desktop)"
value[5] "Corsair"
value[6] "Vengeance"
value[7] "LPX"
...

它似乎卡在了括号中(应该读入value [3]),然后开始在空格处分隔而不是逗号。

很高兴在需要时使用第三方的csv阅读器,但是我很想了解它自己的工作原理。

1 个答案:

答案 0 :(得分:2)

使用string line = sr.ReadLine();但使用RFC 4180 来读取csv, 2.6告诉我们,包含Digote "的字段必须包含多行。

因此,如果文档中存在多个行字段,则逐行读取文件将是一个问题。
我将放弃手工制作的正则表达式和ReadLine,并使用更强大的解析器,例如CSV Helper

然后定义要从CSV获取的对象。

public class Leader
{
    public string LongColumn6 { get; set; }

    public string Supplier { get; set; }
    public string Category { get; set; }
    public string StockCode { get; set; }
    public Decimal Cost { get; set; }
    public string Description { get; set; }
    public string Image { get; set; }
    public string Manufacturer { get; set; }
    public Decimal Sell { get; set; }
    public string StockAdelaide { get; set; }
    public string StockBrisbane { get; set; }
    public string StockMelbourne { get; set; }
    public string StockPerth { get; set; }
    public string StockSydney { get; set; }
    public string Subcategory { get; set; }
}

它是各自的映射器:列&是Foo属性等。

public sealed class LeaderMap : ClassMap<Leader>
{
    public LeaderMap()
    {
        Map(m => m.LongColumn6).Index(5); // the column that cause the issue

        //complete the List
        Map(m => m.Category).Index(2);
        Map(m => m.StockCode).Index(11);
        Map(m => m.Cost).Index(7);
        Map(m => m.Description).Index(4);
    }
}

然后阅读很简单:

using (var csvReader = new CsvReader(reader,  CultureInfo.InvariantCulture ))
{   
    csvReader.Configuration.HasHeaderRecord = false;
    csvReader.Configuration.RegisterClassMap<LeaderMap>();
    records = csvReader.GetRecords<Leader>().ToList();
}

请注意,在此live demo中。 我使用StringReader来模仿文件Reader。
您可以使用文件阅读器并将其传递给您的路径。