我看了我能找到的所有csv阅读示例,但我不确定这是哪里出了错。
我对C#还是陌生的,但到目前为止,还是很喜欢!
无论如何,这是在大多数情况下最有效的代码(您可以通过我在阅读中尝试过多种选择的评论看到):
StreamReader sr = new StreamReader(csvFileToImport);
while (sr.EndOfStream != true)
{
string line = sr.ReadLine();
//string[] value = line.Split(new string[] { "\",\"" }, StringSplitOptions.None);
//string[] value = line.Split(new string[] {","}, StringSplitOptions.None);
//string[] value = line.Split(new string[] { "(?=(?:[^']*'[^']*')*[^']*$)" }, StringSplitOptions.None);
//string[] value = line.Split(new string[] { "," }, StringSplitOptions.None);
string[] value = Regex.Split(line, @"\s|[,]");
StockItem si = new StockItem();
switch (stockFile.Supplier)
{
case "Leader":
si.Supplier = stockFile.Supplier;
si.Category = value[2].Replace("'", "''");
si.StockCode = value[11].Replace("'", "''");
si.Cost = Convert.ToDecimal(value[7]);
si.Description = value[4].Replace("'", "''");
si.Image = value[9].Replace("'", "''");
si.Manufacturer = value[10].Replace("'", "''");
si.Sell = Convert.ToDecimal(value[8]);
si.StockAdelaide = value[17].Replace("'", "''");
si.StockBrisbane = value[18].Replace("'", "''");
si.StockMelbourne = value[19].Replace("'", "''");
si.StockPerth = value[20].Replace("'", "''");
si.StockSydney = value[21].Replace("'", "''");
si.Subcategory = value[3].Replace("'", "''");
//Add line into db
string sql = "insert into Stock (Supplier, StockCode, Manufacturer, Category, Subcategory, Description, Cost, Sell, Image, StockPerth, StockAdelaide, StockSydney, StockBrisbane, StockMelbourne) values ('" + si.Supplier + "', '" + si.StockCode + "', '" + si.Manufacturer + "', '" + si.Category + "', '" + si.Subcategory + "', '" + si.Description + "', " + si.Cost + ", " + si.Sell + ", '" + si.Image + "', '" + si.StockPerth + "', '" + si.StockAdelaide + "', '" + si.StockSydney + "', '" + si.StockBrisbane + "', '" + si.StockMelbourne + "')";
cmd = new SqlCommand(sql, cn);
cmd.ExecuteNonQuery();
break;
default:
break;
}
}
success = true;
cn.Close();
我已经链接到1行csv文件,如果有人会这么好看,我将无法正确读取该文件,我将非常感激!
在此先感谢您,也可以随时指出我可以改进的所有常规代码...我相信还有很多地方可以改进。
再次感谢:)
CSV链接:https://www.dropbox.com/s/nnaruu0twds3wrl/csv_error.csv?dl=0
更新:
由于缺乏清晰性而致歉,因为我在读取文件时遇到以下错误:
System.FormatException:'输入字符串的格式不正确。'
该行显示为:
"MECMD4VL2X426,ME,Memory,DDR-4 (Desktop),Corsair Vengeance LPX 8GB (2x4GB) DDR4 2666MHz C16 Desktop Gaming Memory Black,\"Corsair 8GB (2x4GB) DDR4 2666MHz Vengeance LPX Black"
查询数组时,其值显示为:
value[0] "MECMD4VL2X426"
value[1] "ME"
value[2] "Memory"
value[3] "DDR-4"
value[4] "(Desktop)"
value[5] "Corsair"
value[6] "Vengeance"
value[7] "LPX"
...
它似乎卡在了括号中(应该读入value [3]),然后开始在空格处分隔而不是逗号。
很高兴在需要时使用第三方的csv阅读器,但是我很想了解它自己的工作原理。
答案 0 :(得分:2)
使用string line = sr.ReadLine();
但使用RFC 4180 来读取csv,
2.6告诉我们,包含Digote "
的字段必须包含多行。
因此,如果文档中存在多个行字段,则逐行读取文件将是一个问题。
我将放弃手工制作的正则表达式和ReadLine
,并使用更强大的解析器,例如CSV Helper。
然后定义要从CSV获取的对象。
public class Leader
{
public string LongColumn6 { get; set; }
public string Supplier { get; set; }
public string Category { get; set; }
public string StockCode { get; set; }
public Decimal Cost { get; set; }
public string Description { get; set; }
public string Image { get; set; }
public string Manufacturer { get; set; }
public Decimal Sell { get; set; }
public string StockAdelaide { get; set; }
public string StockBrisbane { get; set; }
public string StockMelbourne { get; set; }
public string StockPerth { get; set; }
public string StockSydney { get; set; }
public string Subcategory { get; set; }
}
它是各自的映射器:列&是Foo属性等。
public sealed class LeaderMap : ClassMap<Leader>
{
public LeaderMap()
{
Map(m => m.LongColumn6).Index(5); // the column that cause the issue
//complete the List
Map(m => m.Category).Index(2);
Map(m => m.StockCode).Index(11);
Map(m => m.Cost).Index(7);
Map(m => m.Description).Index(4);
}
}
然后阅读很简单:
using (var csvReader = new CsvReader(reader, CultureInfo.InvariantCulture ))
{
csvReader.Configuration.HasHeaderRecord = false;
csvReader.Configuration.RegisterClassMap<LeaderMap>();
records = csvReader.GetRecords<Leader>().ToList();
}
请注意,在此live demo中。
我使用StringReader来模仿文件Reader。
您可以使用文件阅读器并将其传递给您的路径。