我已经分析了我的应用程序,看看为什么我的3D矢量实现几乎比相应的C函数调用慢3倍:结果证明每个函数调用比实际执行的算法花费更多的时间!我已经将函数调用的数量减少到3,但这没有多大帮助。
似乎由于某种原因,算术运算符调用比其他函数调用花费的时间更多,并且,在查看反汇编时,我发现了原因:它们是唯一没有内联的函数完全优化!每个调用需要大约10个准备命令,仅用于存储两个操作数。与此相比,调用相应的C函数只需要2个命令来存储每个双指针参数。
这是我的代码的简化部分(根据需要添加包含防护):
// header vector3d.h
class VectorExpression3d;
class Vector3d {
public: // will see about visibility later...
double x, y, z;
Vector3d(const VectorExpression3d& ve);
Vector3d& operator=(const VectorExpression3d& ve);
};
#include "vectorexpression3d.h"
// implementation ...
// header vectorexpression3d.h
#include "vector3d.h"
class VectorExpression3d {
public:
double x, y, z, scale;
VectorExpression3d(const Vector3d& v1, const Vector3d& v2)
: x(v1.x+v2.x), y(v1.y+v2.y), z(v1.z+v2.z), scale(1.0) {}
};
// main cpp file
#include "vector3d.h"
inline VectorExpression3d operator+(const Vector3d& v1, const Vector3d& v2) {
return VectorExpression3d(v1, v2);
}
int main() {
// code
Vector3d v1, v2, v3;
v3 = v1+v2; // invokes non-inlined call to operator+ above,
// then inlined(!) VectorExpression3d constructor
// then inlined(!) Vector3d constructor
// then inlined VectorExpression3d destructor
// ...
}
我正在使用VS 2010,似乎编译器忽略了对任何运算符的内联语句。我知道我不能强迫内联 - 但它应该是可能的,因为操作员是微不足道的,它甚至应该是容易的!那么问题是什么?为什么VS 2010没有内联我的运营商?毕竟不可能吗?
根据我的分析结果,对operator +的调用本身占用了add语句总时间的一半以上,包括临时赋值和构造/销毁!
P.S .: 也许这很重要,但我忘了提到实际的类实际上是模板(目前只有模板arg是基本类型(double),所以不是一个大问题)
答案 0 :(得分:2)
可以内联在类定义中定义的类的任何成员函数函数(包括运算符)。
与使用内联函数(例如在类定义中,或显式声明为inline
的函数)一样,编译器没有义务实际内联函数。允许编译器将内联视为提示,然后忽略该提示。编译设置(例如优化选项)可以使编译器或多或少地积极地进行内联。有些编译器拒绝内联某些函数(例如,有些函数拒绝使用switch
语句内联函数。)
在某些情况下,一些现代编译器甚至足够聪明,可以内联程序员未指定为内联的函数。实际上,现代编译器通常能够比大多数程序员做出更好的内联选择(例如,利用主机系统的功能)。