如何使用带有逗号的C#在CSV中解析数据?

时间:2017-01-18 13:23:32

标签: c# csv parsing textfieldparser

我正在尝试用数据中的逗号解析CSV文件。所有字段都没有引号,但是当它们中有逗号时,有一些美元金额。例如,文件看起来像这样:

0000-0C,Sales-Data Entry,10/31/2016,000000,VJ,Comapny,,312.3
0000-0C,Sales-Data Entry,10/31/2016,000000,VJ,Company,,"1,420.97"

所以你可以看到1,420.97中有一个逗号,但它确实有引号。有没有办法可靠地读取这个文件?

这是我的代码:

var path = @"glid.csv";

TextFieldParser parser = new TextFieldParser(path);

parser.HasFieldsEnclosedInQuotes = true;
parser.SetDelimiters(",");

while (!parser.EndOfData)
{
    parser.ReadLine();
    fields = parser.ReadFields();

    //do something
}

parser.Close();

3 个答案:

答案 0 :(得分:3)

CSV是一只叛逆的鸟,没有人可以驯服,因此绝不会尝试用自己的规则解析它。

我强烈建议您使用OleDbDataAdapter填充数据集而不是Microsoft.VisualBasic.FileIO.TextFieldParser,这可以为您节省大量时间和麻烦。

    string fileName = @"glid.csv";
    DataSet ds = new DataSet("csvData");
    string dir = Path.GetDirectoryName(fileName);
    string connstr = String.Format("Provider = Microsoft.Jet.OleDb.4.0; Data Source={0}; Extended Properties = \"Text;HDR=YES;FMT=Delimited\"",dir);

    using (System.Data.OleDb.OleDbConnection conn = new System.Data.OleDb.OleDbConnection())
    {
        conn.Open();
        OleDbDataAdapter adapter = new OleDbDataAdapter("SELECT * FROM " + Path.GetFileName(fileName), conn);
        adapter.Fill(ds);
    }

    var p = ds; //<-- here is your data;

答案 1 :(得分:3)

您确定要同时使用

吗?
parser.ReadLine();

fields = parser.ReadFields();

根据文档https://msdn.microsoft.com/en-us/library/microsoft.visualbasic.fileio.textfieldparser(v=vs.110).aspx,这将跳过一行,一遍又一遍地处理下一行,直到文件结束。

您可能还希望检查您的编码类型,TextFieldParser构造函数接受编码类型:https://msdn.microsoft.com/en-us/library/ms128085(v=vs.110).aspx

尝试以下编码:https://msdn.microsoft.com/en-us/library/system.text.encoding(v=vs.110).aspx

答案 2 :(得分:0)

说实话,我建议使用this nuget package。它在读取和编写csv时非常有用,甚至允许您直接映射到从记录中创建对象模型的类。它会为你处理所有逃避和复杂的东西。简而言之,它只是有效。

这是非常好的东西,非常容易使用!