我在解析文本文件时构建了两个数组。第一个包含列名,第二个包含当前行的值。我需要一次迭代两个列表来构建一个地图。现在我有以下内容:
var currentValues = currentRow.Split(separatorChar);
var valueEnumerator = currentValues.GetEnumerator();
foreach (String column in columnList)
{
valueEnumerator.MoveNext();
valueMap.Add(column, (String)valueEnumerator.Current);
}
这很好用,但它并不能完全满足我的优雅感,如果阵列的数量大于2,它会变得非常毛茸茸(我偶尔会这样做)。有没有人有另一个更高级的成语?
答案 0 :(得分:22)
你的初始代码中有一个非显而易见的伪bug - IEnumerator<T>
扩展IDisposable
所以你应该处理它。这对于迭代器块来说非常重要!对于数组而言不是问题,但与其他IEnumerable<T>
实现一样。
我会这样做:
public static IEnumerable<TResult> PairUp<TFirst,TSecond,TResult>
(this IEnumerable<TFirst> source, IEnumerable<TSecond> secondSequence,
Func<TFirst,TSecond,TResult> projection)
{
using (IEnumerator<TSecond> secondIter = secondSequence.GetEnumerator())
{
foreach (TFirst first in source)
{
if (!secondIter.MoveNext())
{
throw new ArgumentException
("First sequence longer than second");
}
yield return projection(first, secondIter.Current);
}
if (secondIter.MoveNext())
{
throw new ArgumentException
("Second sequence longer than first");
}
}
}
然后,只要有需要,您就可以重复使用它:
foreach (var pair in columnList.PairUp(currentRow.Split(separatorChar),
(column, value) => new { column, value })
{
// Do something
}
或者你可以创建一个通用的Pair类型,并去掉PairUp方法中的projection参数。
编辑:
使用Pair类型,调用代码如下所示:
foreach (var pair in columnList.PairUp(currentRow.Split(separatorChar))
{
// column = pair.First, value = pair.Second
}
看起来就像你能得到的一样简单。是的,您需要将实用程序方法放在某处,作为可重用的代码。在我看来,这几乎不成问题。现在有多个阵列......
如果阵列的类型不同,我们就会遇到问题。您不能在泛型方法/类型声明中表达任意数量的类型参数 - 您可以根据需要为尽可能多的类型参数编写PairUp的版本,就像Action
和Func
个委托一样最多4个委托参数 - 但你不能让它任意。
如果这些值都属于同一类型,那么 - 如果你很乐意坚持阵列 - 这很容易。 (非阵列也没关系,但你不能提前做长度检查。)你可以这样做:
public static IEnumerable<T[]> Zip<T>(params T[][] sources)
{
// (Insert error checking code here for null or empty sources parameter)
int length = sources[0].Length;
if (!sources.All(array => array.Length == length))
{
throw new ArgumentException("Arrays must all be of the same length");
}
for (int i=0; i < length; i++)
{
// Could do this bit with LINQ if you wanted
T[] result = new T[sources.Length];
for (int j=0; j < result.Length; j++)
{
result[j] = sources[j][i];
}
yield return result;
}
}
然后调用代码为:
foreach (var array in Zip(columns, row, whatevers))
{
// column = array[0]
// value = array[1]
// whatever = array[2]
}
这涉及一定数量的复制,当然 - 您每次都在创建一个数组。你可以通过引入另一种类型来改变它:
public struct Snapshot<T>
{
readonly T[][] sources;
readonly int index;
public Snapshot(T[][] sources, int index)
{
this.sources = sources;
this.index = index;
}
public T this[int element]
{
return sources[element][index];
}
}
这可能被大多数人视为过度杀戮;)
我可以不断提出各种想法,说实话......但基本要素是:
答案 1 :(得分:17)
如果列名与每行中的元素数相同,那么你不能使用for循环吗?
var currentValues = currentRow.Split(separatorChar);
for(var i=0;i<columnList.Length;i++){
// use i to index both (or all) arrays and build your map
}
答案 2 :(得分:4)
在函数式语言中,您通常会找到一个“zip”函数,它有望成为C#4.0的一部分。 Bart de Smet基于现有的LINQ函数提供了一个有趣的zip实现:
public static IEnumerable<TResult> Zip<TFirst, TSecond, TResult>(
this IEnumerable<TFirst> first,
IEnumerable<TSecond> second,
Func<TFirst, TSecond, TResult> func)
{
return first.Select((x, i) => new { X = x, I = i })
.Join(second.Select((x, i) => new { X = x, I = i }),
o => o.I,
i => i.I,
(o, i) => func(o.X, i.X));
}
然后你可以这样做:
int[] s1 = new [] { 1, 2, 3 };
int[] s2 = new[] { 4, 5, 6 };
var result = s1.Zip(s2, (i1, i2) => new {Value1 = i1, Value2 = i2});
答案 3 :(得分:3)
如果您真的使用数组,最好的方法可能只是使用带索引的传统for
循环。不是很好,被授予,但据我所知,.NET并没有提供更好的方法。
您还可以将代码封装到名为zip
的方法中 - 这是一个常见的高阶列表函数。但是,C#缺少合适的元组类型,这是非常苛刻的。你最终会返回一个不是很好的IEnumerable<KeyValuePair<T1, T2>>
。
顺便说一句,您是否真的使用IEnumerable
代替IEnumerable<T>
,或者为什么要投放Current
值?
答案 4 :(得分:3)
使用IEnumerator两者都不错
var currentValues = currentRow.Split(separatorChar);
using (IEnumerator<string> valueEnum = currentValues.GetEnumerator(), columnEnum = columnList.GetEnumerator()) {
while (valueEnum.MoveNext() && columnEnum.MoveNext())
valueMap.Add(columnEnum.Current, valueEnum.Current);
}
或创建扩展方法
public static IEnumerable<TResult> Zip<T1, T2, TResult>(this IEnumerable<T1> source, IEnumerable<T2> other, Func<T1, T2, TResult> selector) {
using (IEnumerator<T1> sourceEnum = source.GetEnumerator()) {
using (IEnumerator<T2> otherEnum = other.GetEnumerator()) {
while (sourceEnum.MoveNext() && columnEnum.MoveNext())
yield return selector(sourceEnum.Current, otherEnum.Current);
}
}
}
用法
var currentValues = currentRow.Split(separatorChar);
foreach (var valueColumnPair in currentValues.Zip(columnList, (a, b) => new { Value = a, Column = b }) {
valueMap.Add(valueColumnPair.Column, valueColumnPair.Value);
}
答案 5 :(得分:2)
不是创建两个单独的数组,而是可以创建一个二维数组或一个字典(这会更好)。但实际上,如果它有效,我不会尝试改变它。