在CSV列中获取第一个值而不重复

时间:2013-10-29 17:09:49

标签: c# visual-studio-2012 csv asp.net-web-api

我使用以下代码通过Web Api从csv文件中获取项目列表:

private List<Item> items = new List<Item>();

        public ItemRepository()
        {
            string filename = HttpRuntime.AppDomainAppPath + "App_Data\\items.csv";

            var lines = File.ReadAllLines(filename).Skip(1).ToList();

            for (int i = 0; i < lines.Count; i++)
            {
                var line = lines[i];

                var columns = line.Split('$');

                //get rid of newline characters in the middle of data lines
                while (columns.Length < 9)
                {
                    i += 1;
                    line = line.Replace("\n", " ") + lines[i];
                    columns = line.Split('$');
                }

                //Remove Starting and Trailing open quotes from fields
                columns = columns.Select(c => { if (string.IsNullOrEmpty(c) == false) { return c.Substring(1, c.Length - 2); } return string.Empty; }).ToArray();


                var temp = columns[5].Split('|', '>');
                items.Add(new Item()
                {
                    Id = int.Parse(columns[0]),
                    Name = temp[0],
                    Description = columns[2],

                    Photo = columns[7]



                });
            }
        }

项目列表的Name属性必须来自结构如下的列:

Groups>Subgroup>item

因此,我在代码中使用var temp = columns[5].Split('|', '>');来获取“&gt;”之前列的第一个元素,在上面的例子中是“组”。这很好。

然而,我在结果中得到了很多重复。这是因为列中的其他项可能是:

(这些是我的csv第9列中的一些条目) Groups>Subgroup2>item2Groups>Subgroup3>item4Groups>Subgroup4>item9

所有内容均以Groups开头,但我只想获得Groups一次。

因为它是Groups的长列表。如何停止重复?

我希望如果列表中的项目与Name“组”一起返回,则不会返回具有该名称的其他项目。如何进行检查并实施?

2 个答案:

答案 0 :(得分:1)

如果您成功获取组列表,请获取该组列表并使用LINQ:

var undupedList = dupedList
    .Distinct();

更新:distinct不起作用的原因是因为你的代码不只是请求Name,而且还有Description,等等......如果你只要求Name,则Distinct()将起作用。

更新2:试试这个:

//Check whether already exists
if((var match = items.Where(q=>q.Name == temp[0])).Count==0)
{
     items.add(...);
}

答案 1 :(得分:0)

如何使用List存储Item.Name? 然后在调用items.Add()

之前检查List.Contains()

简单,只有3行代码,并且可以正常工作。

IList<string> listNames = new List();
//
for (int i = 0; i < lines.Count; i++)
{
    //
    var temp = columns[5].Split('|', '>');
    if (!listNames.Contains(temp[0]))
    {
        listNames.Add(temp[0]);
        items.Add(new Item() 
        { 
            //
        });
    }
}