我正在尝试用数据中的逗号解析CSV文件。所有字段都没有引号,但是当它们中有逗号时,有一些美元金额。例如,文件看起来像这样:
0000-0C,Sales-Data Entry,10/31/2016,000000,VJ,Comapny,,312.3
0000-0C,Sales-Data Entry,10/31/2016,000000,VJ,Company,,"1,420.97"
所以你可以看到1,420.97中有一个逗号,但它确实有引号。有没有办法可靠地读取这个文件?
这是我的代码:
var path = @"glid.csv";
TextFieldParser parser = new TextFieldParser(path);
parser.HasFieldsEnclosedInQuotes = true;
parser.SetDelimiters(",");
while (!parser.EndOfData)
{
parser.ReadLine();
fields = parser.ReadFields();
//do something
}
parser.Close();
答案 0 :(得分:3)
CSV是一只叛逆的鸟,没有人可以驯服,因此绝不会尝试用自己的规则解析它。
我强烈建议您使用OleDbDataAdapter
填充数据集而不是Microsoft.VisualBasic.FileIO.TextFieldParser
,这可以为您节省大量时间和麻烦。
string fileName = @"glid.csv";
DataSet ds = new DataSet("csvData");
string dir = Path.GetDirectoryName(fileName);
string connstr = String.Format("Provider = Microsoft.Jet.OleDb.4.0; Data Source={0}; Extended Properties = \"Text;HDR=YES;FMT=Delimited\"",dir);
using (System.Data.OleDb.OleDbConnection conn = new System.Data.OleDb.OleDbConnection())
{
conn.Open();
OleDbDataAdapter adapter = new OleDbDataAdapter("SELECT * FROM " + Path.GetFileName(fileName), conn);
adapter.Fill(ds);
}
var p = ds; //<-- here is your data;
答案 1 :(得分:3)
您确定要同时使用
吗?parser.ReadLine();
和
fields = parser.ReadFields();
根据文档https://msdn.microsoft.com/en-us/library/microsoft.visualbasic.fileio.textfieldparser(v=vs.110).aspx,这将跳过一行,一遍又一遍地处理下一行,直到文件结束。
您可能还希望检查您的编码类型,TextFieldParser构造函数接受编码类型:https://msdn.microsoft.com/en-us/library/ms128085(v=vs.110).aspx
尝试以下编码:https://msdn.microsoft.com/en-us/library/system.text.encoding(v=vs.110).aspx
答案 2 :(得分:0)
说实话,我建议使用this nuget package。它在读取和编写csv时非常有用,甚至允许您直接映射到从记录中创建对象模型的类。它会为你处理所有逃避和复杂的东西。简而言之,它只是有效。
这是非常好的东西,非常容易使用!