Lumenworks Csv reader读取具有相同名称的列或避免“已添加具有相同键的项目”

时间:2014-12-30 07:13:18

标签: c# csv lumenworks

我想知道是否有办法让CSV阅读器读取CSV中的所有列(具有相同的列名)。我收到An item with the same key has already been added错误。我希望这个工作,因为我的逻辑是创建一个类似命名列的数组(如果它存在),然后为数组元素的每个实例编写更多逻辑。

最后一点是我希望能够读取所有列,即使有相同名称的列也是如此。我正在使用自定义对象来保存名称值数据。因此无需担心字典导致相同的密钥存在错误。如果Lumen-works CSV不支持它,那么我可以使用什么?我的CSV文件也有Json数据(带双引号,逗号)我也需要处理它。

2 个答案:

答案 0 :(得分:3)

您已经难过了 - 我不知道任何会解决重复列标题的CSV解析器,而且我已经测试了其中的一些。但是,有一些CSV解析器可以为您提供原始列数据,并且通过一些支持,您可以将其用作构建块,以使您的数据更加友好。

这将返回Dictionary<string, List<string>>的序列,每个记录一个,其中键是标题,列表是具有相同标题的所有列:

using System.IO;
using System.Collections.Generic;
using Ctl.Data;

static IEnumerable<Dictionary<string, List<string>>> ReadCsv(string filePath)
{
    using (StreamReader sr = new StreamReader(filePath))
    {
        CsvReader csv = new CsvReader(sr);

        // first read in the header.

        if (!csv.Read())
        {
            yield break; // an empty file, break out early.
        }

        RowValue header = csv.CurrentRow;

        // now the records.

        while (csv.Read())
        {
            Dictionary<string, List<string>> dict =
                new Dictionary<string, List<string>>(header.Count);

            RowValue record = csv.CurrentRow;

            // map each column to a header value

            for (int i = 0; i < record.Count; ++i)
            {
                // if there are more values in the record than the header,
                // assume an empty string as header.

                string headerValue = (i < header.Count ? header[i].Value : null)
                    ?? string.Empty;

                // get the list, or create if it doesn't exist.

                List<string> list;

                if (!dict.TryGetValue(headerValue, out list))
                {
                    dict[headerValue] = list = new List<string>();
                }

                // finally add column value to the list.

                list.Add(record[i].Value);
            }

            yield return dict;
        }
    }
}

我对Lumenworks不太熟悉 - 这使用Ctl.Data,我知道这将允许格式化的JSON数据和列中的任何其他奇怪,只要它被正确引用。 (免责声明:我是Ctl.Data的作者)

答案 1 :(得分:0)

由于jonreis,从LumenWorks 4.0开始支持此功能。

请参阅LumenWorks.Framework.Tests.Unit / IO / Csv / CsvReaderTest.cs

    using (CsvReader csvReader = new CsvReader(new StringReader("Header,Header\r\nValue1,Value2"), true))
        {
          csvReader.DuplicateHeaderEncountered += (s, e) => e.HeaderName = $"{e.HeaderName}_{e.Index}";