我想知道是否有办法让CSV阅读器读取CSV中的所有列(具有相同的列名)。我收到An item with the same key has already been added
错误。我希望这个工作,因为我的逻辑是创建一个类似命名列的数组(如果它存在),然后为数组元素的每个实例编写更多逻辑。
最后一点是我希望能够读取所有列,即使有相同名称的列也是如此。我正在使用自定义对象来保存名称值数据。因此无需担心字典导致相同的密钥存在错误。如果Lumen-works CSV不支持它,那么我可以使用什么?我的CSV文件也有Json数据(带双引号,逗号)我也需要处理它。
答案 0 :(得分:3)
您已经难过了 - 我不知道任何会解决重复列标题的CSV解析器,而且我已经测试了其中的一些。但是,有一些CSV解析器可以为您提供原始列数据,并且通过一些支持,您可以将其用作构建块,以使您的数据更加友好。
这将返回Dictionary<string, List<string>>
的序列,每个记录一个,其中键是标题,列表是具有相同标题的所有列:
using System.IO;
using System.Collections.Generic;
using Ctl.Data;
static IEnumerable<Dictionary<string, List<string>>> ReadCsv(string filePath)
{
using (StreamReader sr = new StreamReader(filePath))
{
CsvReader csv = new CsvReader(sr);
// first read in the header.
if (!csv.Read())
{
yield break; // an empty file, break out early.
}
RowValue header = csv.CurrentRow;
// now the records.
while (csv.Read())
{
Dictionary<string, List<string>> dict =
new Dictionary<string, List<string>>(header.Count);
RowValue record = csv.CurrentRow;
// map each column to a header value
for (int i = 0; i < record.Count; ++i)
{
// if there are more values in the record than the header,
// assume an empty string as header.
string headerValue = (i < header.Count ? header[i].Value : null)
?? string.Empty;
// get the list, or create if it doesn't exist.
List<string> list;
if (!dict.TryGetValue(headerValue, out list))
{
dict[headerValue] = list = new List<string>();
}
// finally add column value to the list.
list.Add(record[i].Value);
}
yield return dict;
}
}
}
我对Lumenworks不太熟悉 - 这使用Ctl.Data,我知道这将允许格式化的JSON数据和列中的任何其他奇怪,只要它被正确引用。 (免责声明:我是Ctl.Data的作者)
答案 1 :(得分:0)
由于jonreis,从LumenWorks 4.0开始支持此功能。
请参阅LumenWorks.Framework.Tests.Unit / IO / Csv / CsvReaderTest.cs
using (CsvReader csvReader = new CsvReader(new StringReader("Header,Header\r\nValue1,Value2"), true))
{
csvReader.DuplicateHeaderEncountered += (s, e) => e.HeaderName = $"{e.HeaderName}_{e.Index}";