GroupBy()后LINQ中的数组索引对元素求平均值

时间:2016-07-29 04:50:09

标签: c# .net linq group-by

我想在C#中找到一个相当专业的查询。

我有一个班级:

class TimeValues 
{
    DateTime When;
    ImmutableArray<float> Values;
}

这表示特定时间的许多传感器的报告。我在ImmutableArray<TimeValues> SomeArray中使用的,代表了一系列报告,通常是第二个报告。

我想解决的问题是如何按30秒间隔进行分组,并单独平均每个传感器的报告。

例如,如果我有两个报告:

      s1   s2   s3
1:20  10   20   30
1:21  30   50   70

我们假设t1和t2彼此在30秒内,我希望操作导致:

      s1          s2          s3
1:00  avg(10,30)  avg(20,50)  avg(30,70)

我已经开始使用以下内容:

SomeArray.GroupBy(k => k.When.Second >= 30
       ? k.When.AddSeconds(-k.When.Second + 30)
       : k.When.AddSeconds(-k.When.Second), k => k.Values)
   .Select(group => new TimeValues(group.Key, ...))

这是我无法弄清楚的最后一行。必须强调的一点是,必须保持平均值的顺序,因为它必须与传感器报告相对应。这是我第一次在LINQ中使用group by,可能是其中一个比较复杂的。

2 个答案:

答案 0 :(得分:2)

我想你不能用花哨的单行方式写它,但你仍然可以用这样的东西来工作:

        var aggregateValues = timeValues
            .GroupBy(k => k.When.Second >= 30
                ? k.When.AddSeconds(-k.When.Second + 30)
                : k.When.AddSeconds(-k.When.Second), k => k)
            .Select(group =>
            {
                var tv = new TimeValues() { When = group.Key };
                var values = new List<int>(3);
                for (int index = 0; index < 3; index++)
                {
                    values.Add(group.Average(t => t.Values[index]));
                }
                tv.Values = values.ToImmutableArray();
                return values;
            });

您还应该注意,在此选择器代码中指定数组长度(数字3)是不可取的,就像我一样。您应该静态地在某处声明此常量,并确保在构造函数或属性设置器中显式检查您的TimeValues实例在其值数组中始终具有3个值。这有助于您避免IndexOutRangeExceptions

答案 1 :(得分:2)

可以说,您的问题与Average int Array elements with a GroupBy重复。但是,我对特定答案并不感到兴奋,即它多次迭代组结果,对于values数组中的每个索引一次。恕我直言,最好一次迭代组,将重复的迭代放在值数组本身上。你的问题的陈述比另一个好,所以我在这里给出答案。 :)


首先,我不明白你的分组功能。如果你想要30秒的间隔,在我看来,只需将秒数除以30就可以给你一个很好的分组键。你似乎很难完成基本相同的事情。

其次,我不想用ImmutableArray<T>安装包,并且该类与问题没有任何关系,所以我的答案只使用了一个普通的旧数组。

第三,我不相信this answer甚至做你想要的。一个from Meleagre看起来很不错,但我会采取不同的方法,如下所示:

var result = from g in (from d in data
                 group d by (int)(d.When.TotalSeconds / 30))
             let c = g.Count()
             select new TimeValues(TimeSpan.FromSeconds(g.Key * 30),
                g.Aggregate(new float[g.First().Values.Length],
                    (a, tv) =>
                    {
                        for (int i = 0; i < a.Length; i++)
                        {
                            a[i] += tv.Values[i];
                        }

                        return a;
                    },
                    a =>
                    {
                        for (int i = 0; i < a.Length; i++)
                        {
                            a[i] /= c;
                        }

                        return a;
                    }));

以上使用LINQ Aggregate()方法在各自的索引中累积每个值,然后计算最后的平均值。两种不同的lambda匿名方法分别用于这些功能。恕我直言,如果你把它们分解成实际命名的方法,代码实际上会更具可读性。无论哪种方式都没问题。

我更喜欢这种方法,因为它最小化了对象分配(无需构建列表,然后在最后转换为数组),并且恕我直言更清楚地表达了代码背后的 intent

我相信您可以调整基于数组的示例以使用ImmutableArray<T>。 :)