帮助Linq和Dictionary的ContainsKey方法

时间:2010-08-18 03:10:52

标签: c# linq dictionary linq-to-objects

我正在编写一个工具,该工具的第一部分是收集公共API中的所有头文件。问题是,两个头文件有重复的文件名(但它们位于不同的文件夹中)。这将在创建字典时导致问题。

最初我编写了一个foreach循环来将FileInfo实例收集到字典中。但是最近我正在学习LINQ,我想将foreach循环转换为LINQ语句。 问题是当它执行时,它抱怨重复的文件名。

以下是原始代码:

public Dictionary<String, FileDependency> GetSDKFiles(DirectoryInfo dir)
{
    Dictionary<String, FileDependency> list = new Dictionary<String, FileDependency>();
    foreach (FileInfo info in dir.EnumerateFiles("*.h", SearchOption.AllDirectories))
    {
        String key = info.Name.ToLower();
        if (list.ContainsKey(key) == false)
        {
            list.Add(key, new FileDependency(info.FullName));
        }
        else
        {
            Debug.Print("Duplicate key: {0}", info.Name);
            Debug.Print("  File: {0}", info.FullName);
            Debug.Print("  Have: {0}", list[key].FullFileName);
        }
    }

    return list;
}

我试着像这样转入LINQ:

public Dictionary<String, FileDependency> GetSDKFilesLINQ(DirectoryInfo dir)
{
    var files = from info in dir.EnumerateFiles("*.h", SearchOption.AllDirectories)
                let key = info.Name.ToLower()
                let dep = new FileDependency(info.FullName)
                select new { key, dep };
    return files.ToDictionary(v => v.key, v => v.dep);
}

但是在运行时我得到了这个:

  

已添加具有相同键的项目。

在foreach循环中很容易避免这种情况,因为我调用了ContainsKey方法以确保我没有重复。但是LINQ等价物是什么?

我在哪里使用? - 怎么样? 我是否使用团体? - 怎么样?

感谢。

2 个答案:

答案 0 :(得分:5)

var files = dir.EnumerateFiles("*.h", SearchOption.AllDirectories)
               .GroupBy(file => file.Name.ToLower())
               .Select(group => new {Key = group.Key, Value = group.First()})
               .ToDictionary(a => a.Key, a => new FileDependency (a.Value.FullName));

如果你有MoreLinq,你可以这样做:

var files =  dir.EnumerateFiles("*.h", SearchOption.AllDirectories)
                .DistinctBy(file => file.Name.ToLower())
                .ToDictionary(file => new FileDependency (a.Value.FullName));

或者,您可以为文件编写自己的IEqualityComparer实现,并使用标准Distinct方法。这里的整个问题是Distinct(至少从.NET 3.5开始)没有带有重载,允许将自己的“distinctness”定义作为lambda表达式插入。

答案 1 :(得分:1)

您可以按键分组,并从dep的组中获取第一个值:

public Dictionary<String, FileDependency> GetSDKFilesLINQ(DirectoryInfo dir)
{
    var files = from info in dir.EnumerateFiles(
                    "*.h", SearchOption.AllDirectories)
                let key = info.Name.ToLower()
                let dep = new FileDependency(info.FullName)
                group dep by key into g
                select new { key = g.Key, dep = g.First() };
    return files.ToDictionary(v => v.key, v => v.dep);
}

这将默默地忽略重复。或者,您可以使用Lookup代替词典:

public ILookup<String, FileDependency> GetSDKFilesLINQ2(DirectoryInfo dir)
{
    var files = from info in dir.EnumerateFiles(
                    "*.h", SearchOption.AllDirectories)
                let key = info.Name.ToLower()
                let dep = new FileDependency(info.FullName)
                select new { key, dep };
    return files.ToLookup(v => v.key, v => v.dep);
}

查找中的索引器将返回IEnumerable<FileDependency>,因此您可以看到所有值。