我正在编写一个工具,该工具的第一部分是收集公共API中的所有头文件。问题是,两个头文件有重复的文件名(但它们位于不同的文件夹中)。这将在创建字典时导致问题。
最初我编写了一个foreach循环来将FileInfo实例收集到字典中。但是最近我正在学习LINQ,我想将foreach循环转换为LINQ语句。 问题是当它执行时,它抱怨重复的文件名。
以下是原始代码:
public Dictionary<String, FileDependency> GetSDKFiles(DirectoryInfo dir)
{
Dictionary<String, FileDependency> list = new Dictionary<String, FileDependency>();
foreach (FileInfo info in dir.EnumerateFiles("*.h", SearchOption.AllDirectories))
{
String key = info.Name.ToLower();
if (list.ContainsKey(key) == false)
{
list.Add(key, new FileDependency(info.FullName));
}
else
{
Debug.Print("Duplicate key: {0}", info.Name);
Debug.Print(" File: {0}", info.FullName);
Debug.Print(" Have: {0}", list[key].FullFileName);
}
}
return list;
}
我试着像这样转入LINQ:
public Dictionary<String, FileDependency> GetSDKFilesLINQ(DirectoryInfo dir)
{
var files = from info in dir.EnumerateFiles("*.h", SearchOption.AllDirectories)
let key = info.Name.ToLower()
let dep = new FileDependency(info.FullName)
select new { key, dep };
return files.ToDictionary(v => v.key, v => v.dep);
}
但是在运行时我得到了这个:
已添加具有相同键的项目。
在foreach循环中很容易避免这种情况,因为我调用了ContainsKey方法以确保我没有重复。但是LINQ等价物是什么?
我在哪里使用? - 怎么样? 我是否使用团体? - 怎么样?
感谢。
答案 0 :(得分:5)
var files = dir.EnumerateFiles("*.h", SearchOption.AllDirectories)
.GroupBy(file => file.Name.ToLower())
.Select(group => new {Key = group.Key, Value = group.First()})
.ToDictionary(a => a.Key, a => new FileDependency (a.Value.FullName));
如果你有MoreLinq,你可以这样做:
var files = dir.EnumerateFiles("*.h", SearchOption.AllDirectories)
.DistinctBy(file => file.Name.ToLower())
.ToDictionary(file => new FileDependency (a.Value.FullName));
或者,您可以为文件编写自己的IEqualityComparer
实现,并使用标准Distinct
方法。这里的整个问题是Distinct
(至少从.NET 3.5开始)没有带有重载,允许将自己的“distinctness”定义作为lambda表达式插入。
答案 1 :(得分:1)
您可以按键分组,并从dep的组中获取第一个值:
public Dictionary<String, FileDependency> GetSDKFilesLINQ(DirectoryInfo dir)
{
var files = from info in dir.EnumerateFiles(
"*.h", SearchOption.AllDirectories)
let key = info.Name.ToLower()
let dep = new FileDependency(info.FullName)
group dep by key into g
select new { key = g.Key, dep = g.First() };
return files.ToDictionary(v => v.key, v => v.dep);
}
这将默默地忽略重复。或者,您可以使用Lookup代替词典:
public ILookup<String, FileDependency> GetSDKFilesLINQ2(DirectoryInfo dir)
{
var files = from info in dir.EnumerateFiles(
"*.h", SearchOption.AllDirectories)
let key = info.Name.ToLower()
let dep = new FileDependency(info.FullName)
select new { key, dep };
return files.ToLookup(v => v.key, v => v.dep);
}
查找中的索引器将返回IEnumerable<FileDependency>
,因此您可以看到所有值。