我在这段代码上运行AQTime,我发现.IndexOf需要16%的时间而接近80%的其他部分......他们似乎使用相同的IsEqual和其他例程。被称为116,000次,插入30,000件物品。没有List<>对象有超过200个元素。 (我可能错误地使用AQTime,我正在研究这个)
class PointD : IEquatable<PointD>
{
public double X, Y, Z;
bool IEquatable<PointD>.Equals(PointD other)
{
return ((X == other.X) && (Y == other.Y) && (Z == other.Z));
}
}
class PerfTest
{
readonly List<PointD> _pCoord3Points = new List<PointD>();
public int NewPoints;
public int TotalPoints;
public PerfTest()
{
NewPoints = 0;
TotalPoints = 0;
}
public int CheckPointIndexOf(PointD pt)
{
int retIndex = _pCoord3Points.IndexOf(pt);
if (retIndex < 0)
{
_pCoord3Points.Add(pt);
NewPoints++;
}
TotalPoints++;
return retIndex;
}
public int CheckPointForBreak(PointD pt)
{
int retIndex = -1;
for (int i = 0; i < _pCoord3Points.Count; i++)
{
PointD otherPt = _pCoord3Points[i];
if ((pt.X == otherPt.X) &&
(pt.Y == otherPt.Y) &&
(pt.Z == otherPt.Z))
{
retIndex = i;
break;
}
}
if (retIndex == -1)
{
NewPoints++;
_pCoord3Points.Add(pt);
}
TotalPoints++;
return retIndex;
}
static void Main()
{
const int xmax = 300;
const int ymax = 10;
const int zmax = 10;
const int imax = 4;
var test = new PerfTest();
//test.Init();
Stopwatch sw = Stopwatch.StartNew();
for (int i = 0; i < imax; i++)
{
for (int x = 0; x < xmax; x++)
{
for (int y = 0; y < ymax; y++)
{
for (int z = 0; z < zmax; z++)
{
var pt = new PointD { X = x, Y = y, Z = z };
test.CheckPointIndexOf(pt);
}
}
}
}
sw.Stop();
string output = string.Format("Total: {0:0} New: {1:0} IndexOf: ", test.TotalPoints, test.NewPoints);
Console.Write(output);
Console.WriteLine(sw.Elapsed);
test = new PerfTest();
sw = Stopwatch.StartNew();
for (int i = 0; i < imax; i++)
{
for (int x = 0; x < xmax; x++)
{
for (int y = 0; y < ymax; y++)
{
for (int z = 0; z < zmax; z++)
{
var pt = new PointD { X = x, Y = y, Z = z };
test.CheckPointForBreak(pt);
}
}
}
}
sw.Stop();
output = string.Format("Total: {0:0} New: {1:0} PointD[] ", test.TotalPoints, test.NewPoints);
Console.Write(output);
Console.WriteLine(sw.Elapsed);
Console.ReadLine();
}
}
答案 0 :(得分:9)
我做了以下假设:
PointD
是一个结构IndexOf
确实比手动迭代列表您可以通过实施IndexOf
界面加快IEquatable<T>
:
struct PointD : IEquatable<PointD>
{
public int X;
public int Y;
public int Z;
public bool Equals(PointD other)
{
return (this.X == other.X) &&
(this.Y == other.Y) &&
(this.Z == other.Z);
}
}
如果不实施IEquatable<T>
界面,IndexOf
将使用PointD
比较两个ValueType.Equals(object other)
元素,这涉及昂贵的装箱操作。
IEquatable<T>
接口的文档说明:
在
IEquatable<T>
等方法中测试相等性时,Dictionary<TKey, TValue>
接口由List<T>
,LinkedList<T>
和Contains
等通用集合对象使用,IndexOf
,LastIndexOf
和Remove
。 应该对可能存储在泛型集合中的任何对象实施。
以下是我的完整基准代码:
using System;
using System.Collections.Generic;
using System.Diagnostics;
struct PointD
{
public int X;
public int Y;
public int Z;
}
class PerfTest
{
List<PointD> _pCoord3Points = new List<PointD>();
int checkPointIndexOf(PointD pt)
{
return _pCoord3Points.IndexOf(pt);
}
int checkPointForBreak(PointD pt)
{
int retIndex = -1;
for (int i = 0; i < _pCoord3Points.Count; i++)
{
PointD otherPt = _pCoord3Points[i];
if ((pt.X == otherPt.X) &&
(pt.Y == otherPt.Y) &&
(pt.Z == otherPt.Z))
retIndex = i;
break;
}
return retIndex;
}
void init()
{
for (int x = 0; x < 100; x++)
{
for (int y = 0; y < 10; y++)
{
for (int z = 0; z < 10; z++)
{
PointD pt = new PointD() { X = x, Y = y, Z = z };
_pCoord3Points.Add(pt);
}
}
}
}
static void Main(string[] args)
{
PerfTest test = new PerfTest();
test.init();
Stopwatch sw = Stopwatch.StartNew();
for (int x = 0; x < 100; x++)
{
for (int y = 0; y < 10; y++)
{
for (int z = 0; z < 10; z++)
{
PointD pt = new PointD() { X = x, Y = y, Z = z };
test.checkPointIndexOf(pt);
}
}
}
sw.Stop();
Console.WriteLine(sw.Elapsed);
sw = Stopwatch.StartNew();
for (int x = 0; x < 100; x++)
{
for (int y = 0; y < 10; y++)
{
for (int z = 0; z < 10; z++)
{
PointD pt = new PointD() { X = x, Y = y, Z = z };
test.checkPointForBreak(pt);
}
}
}
sw.Stop();
Console.WriteLine(sw.Elapsed);
}
}
在Windows 7,x64,.NET 4.0 x64版本上,我得到以下时间(约):
IndexOf: 00:00:04.8096623 For Loop: 00:00:00.0014203
将PointD
变为class
时,时间会变为
IndexOf: 00:00:01.0703627 For Loop: 00:00:00.0014190
使用struct PointD
实施IEquatable<PointD>
时,我会得到更多“相似”的结果,但IndexOf
仍然较慢(现在使用class
时没有显着差异) :
IndexOf: 00:00:00.3904615 For Loop: 00:00:00.0015218
答案 1 :(得分:4)
通常,在访问数组元素之前,它会检查以确保索引是&gt; = 0和&lt;长度 - 这样您就不会读取或覆盖不属于您的内存。除此之外,它还消除了一系列严重的安全漏洞,称为buffer overflows。
毋庸置疑,如果循环中的代码非常少,则会妨碍性能。为了减轻这个问题,JIT编译器优化了for (i = 0; i < array.Length; i++) { array[i]; }
形式的for循环 - 也就是说,访问从0到length的数组的所有索引的任何循环 - 1.它省略了对这种情况的边界检查。 (如果你访问像array [i + 1]这样的东西,优化就会失败,因为你可能会超越边界。)
不幸的是,这仅适用于数组,而不适用于List&lt;&gt; s。因此,后一个代码将不会被优化。
但是因为List&lt;&gt;内部包含一个数组,List.IndexOf()使用循环直接访问数组中的每个值,它可以进行优化。
顺便说一句,最好说for (int i = 0; i < array.Length; i++) { }
而不是说int length = array.Length; for(int i = 0; i < length; i++) { }
- 因为它无法确定length
是否真的是数组的长度。< / p>
编辑:使用Reflector查看IndexOf代码,循环确实会优化,但正如其他人提到的那样,它调用Equals() - 这需要vtable lookup和各种健全性检查。因此,在这种情况下,当您没有使用分析器运行时,IndexOf实际上可能会更慢。
反汇编的代码:
internal virtual int IndexOf(T[] array, T value, int startIndex, int count)
{
int num = startIndex + count;
for (int i = startIndex; i < num; i++)
{
if (this.Equals(array[i], value))
{
return i;
}
}
return -1;
}
答案 2 :(得分:0)
_pCoord3Points
的类型是什么?如果元素类型是仅覆盖Equals(object)
的值类型,那么IndexOf
可能会反复装箱值以检查是否相等。 可能解释它。尽管如此,这只是猜测......如果你能提供一个简短但完整的程序来证明这个问题,这将使你更容易帮助你。