我有一个列表,其中每个元素包含两个值(V1和V2)。我需要的是具有最高V1和最高V2的元素(优先考虑V1)。
我尝试了两种方法:
OrderByDescending和ThenByDescending,然后取第一个元素:
list.OrderByDescending(e => e.V1).ThenByDescending(e => e.V2).First();
选择具有最大V1的元素,然后从此可枚举中选择具有最大V2的第一个元素:
var maxV1 = l.Where(e => e.V1 == l.Max(e => e.V1));
maxV1.First(e => e.V2 == maxV1.Max(e1 => e1.V2));
两者(在我的用例中)需要相当长的时间,我对我的任何一种解决方案都不满意。
列表本身不包含很多元素,不超过100个。但是它们有很多。
还有另一个,最好是效率更高的解决方案,而不是我已经尝试过的解决方案吗?或者我是否需要重新考虑整个架构?
编辑:我忘了提到每个元素中有更多变量可用于选择最高值。使用哪一个取决于参数。因此,使用已排序的集合进行预排序并不能带来任何好处。
答案 0 :(得分:4)
您可以使用GroupBy
,然后按V2订购此V1组:
var highestItemByV1V2 = list.GroupBy(x => x.V1)
.OrderByDescending(g => g.Key)
.Select(g => g.OrderByDescending(x => x.V2).First())
.First();
您还应该存储最大值,而不是在查询中将其用作表达式,否则将始终进行评估。所以这更有效:
var highestV1 = list.Max(x => x.V1);
var maxObj = list.Where(x => x.V1 == highestV1).OrderByDescending(x => x.V2).First();
但是,您的第一种方法应该表现良好,简单而有效:
list.OrderByDescending(e => e.V1).ThenByDescending(e => e.V2).First();
那么你有什么样的性能问题?也许你在错误的地方闲逛,或者你经常调用这段代码。考虑将它们存储已经排序,f.e。在SortedList
。在这种情况下,我认为SortedDictionary
甚至是more efficient。
SortedDictionary<TKey, TValue>
泛型类是二进制搜索 具有O(log n)检索的树,其中n是元素的数量 字典。在这方面,它类似于SortedList<TKey, TValue>
泛型类。这两个类有相似的对象模型, 并且都有O(log n)检索。两个班级不同的地方是 记忆的使用和插入和移除的速度:
SortedList<TKey, TValue>
使用的内存少于SortedDictionary<TKey, TValue>
。SortedDictionary<TKey, TValue>
对未排序数据的插入和删除操作更快:O(log n)而不是SortedList<TKey, TValue>
的O(n)。SortedList<TKey, TValue>
比SortedDictionary<TKey, TValue>
快。以下是使用SortedDictionary<double, SortedSet<Obj>>
:
SortedDictionary<double, SortedSet<Obj>> sortedLookup =
new SortedDictionary<double, SortedSet<Obj>>(); // key is V1 and value all items with that value
internal class ObjV2Comparer : IComparer<Obj>
{
public int Compare(Obj x, Obj y)
{
return x.V2.CompareTo(y.V2);
}
}
private static readonly ObjV2Comparer V2Comparer = new ObjV2Comparer();
public void Add(Obj obj)
{
SortedSet<Obj> set;
bool exists = sortedLookup.TryGetValue(obj.V1, out set);
if(!exists)
set = new SortedSet<Obj>(V2Comparer);
set.Add(obj);
sortedLookup[obj.V1] = set;
}
public Obj GetMaxItem()
{
if (sortedLookup.Count == 0) return null;
Obj maxV1Item = sortedLookup.Last().Value.Last();
return maxV1Item;
}
Obj
是包含V1
和V2
的类,我假设V1
是double
这样的原始类型。 GetMaxItem
是返回max-item的方法。
如果V1
和 V2
可以包含重复内容,您可以尝试这种方法,其中每个SortedDictionary
的密钥是V1
值,该值是另一个SortedDictionary
,其中包含V2
- 键和所有相关对象。
SortedDictionary<double, SortedDictionary<double, List<Obj>>> sortedLookup =
new SortedDictionary<double, SortedDictionary<double, List<Obj>>>();
public void Add(Obj obj)
{
SortedDictionary<double, List<Obj>> value;
bool exists = sortedLookup.TryGetValue(obj.V1, out value);
if(!exists)
{
value = new SortedDictionary<double, List<Obj>>(){{obj.V2, new List<Obj>{obj}}};
sortedLookup.Add(obj.V1, value);
}
else
{
List<Obj> list;
exists = value.TryGetValue(obj.V2, out list);
if (!exists)
list = new List<Obj>();
list.Add(obj);
value[obj.V2] = list;
sortedLookup[obj.V1] = value;
}
}
public Obj GetMaxItem()
{
if (sortedLookup.Count == 0) return null;
Obj maxV1Item = sortedLookup.Last().Value.Last().Value.Last();
return maxV1Item;
}
答案 1 :(得分:2)
非LINQ(我为此示例使用了System.Drawing.Point结构):
static Point GetHighestXY(Point[] points)
{
Point max = default(Point);
for (int i = 0; i < points.Length; i++)
{
if (points[i].X < max.X) continue;
if (points[i].X > max.X) { max = points[i]; }
else { if (points[i].Y > max.Y) max = points[i]; }
}
return max;
}
用法示例:
Point[] pts =
{
new Point(55, 8),
new Point(55, 10),
new Point(10, 10),
new Point(22, 11),
new Point(16, 33),
new Point(4, 104)
};
Point max = GetHighestXY(pts);
Console.WriteLine("X : {0} Y : {1} ", max.X, max.Y);
结果:
答案 2 :(得分:2)
与往常一样,如果您只想要最大值,则无需进行任何排序 - Aggregate
为O(n):
var maxByBoth = items.Aggregate(
(bestSoFar, current) =>
{
if (current.V1 > bestSoFar.V1)
return current;
if (current.V1 == bestSoFar.V1 && current.V2 > bestSoFar.V2)
return current;
return bestSoFar;
});