我使用以下代码通过Web Api从csv文件中获取项目列表:
private List<Item> items = new List<Item>();
public ItemRepository()
{
string filename = HttpRuntime.AppDomainAppPath + "App_Data\\items.csv";
var lines = File.ReadAllLines(filename).Skip(1).ToList();
for (int i = 0; i < lines.Count; i++)
{
var line = lines[i];
var columns = line.Split('$');
//get rid of newline characters in the middle of data lines
while (columns.Length < 9)
{
i += 1;
line = line.Replace("\n", " ") + lines[i];
columns = line.Split('$');
}
//Remove Starting and Trailing open quotes from fields
columns = columns.Select(c => { if (string.IsNullOrEmpty(c) == false) { return c.Substring(1, c.Length - 2); } return string.Empty; }).ToArray();
var temp = columns[5].Split('|', '>');
items.Add(new Item()
{
Id = int.Parse(columns[0]),
Name = temp[0],
Description = columns[2],
Photo = columns[7]
});
}
}
项目列表的Name属性必须来自结构如下的列:
Groups>Subgroup>item
因此,我在代码中使用var temp = columns[5].Split('|', '>');
来获取“&gt;”之前列的第一个元素,在上面的例子中是“组”。这很好。
然而,我在结果中得到了很多重复。这是因为列中的其他项可能是:
(这些是我的csv第9列中的一些条目)
Groups>Subgroup2>item2
,Groups>Subgroup3>item4
,Groups>Subgroup4>item9
所有内容均以Groups
开头,但我只想获得Groups
一次。
因为它是Groups
的长列表。如何停止重复?
我希望如果列表中的项目与Name
“组”一起返回,则不会返回具有该名称的其他项目。如何进行检查并实施?
答案 0 :(得分:1)
如果您成功获取组列表,请获取该组列表并使用LINQ:
var undupedList = dupedList
.Distinct();
更新:distinct不起作用的原因是因为你的代码不只是请求Name,而且还有Description,等等......如果你只要求Name,则Distinct()将起作用。
更新2:试试这个:
//Check whether already exists
if((var match = items.Where(q=>q.Name == temp[0])).Count==0)
{
items.add(...);
}
答案 1 :(得分:0)
如何使用List存储Item.Name? 然后在调用items.Add()
之前检查List.Contains()简单,只有3行代码,并且可以正常工作。
IList<string> listNames = new List();
//
for (int i = 0; i < lines.Count; i++)
{
//
var temp = columns[5].Split('|', '>');
if (!listNames.Contains(temp[0]))
{
listNames.Add(temp[0]);
items.Add(new Item()
{
//
});
}
}