在他的书The C++ Standard Library (Second Edition)
中,Nicolai Josuttis指出,编译器可以比普通函数更好地优化lambdas。
此外,C ++编译器比它们更好地优化lambdas 普通功能。 (第213页)
为什么?
我认为在内联时不应该有任何区别。我能想到的唯一原因是编译器可能有一个更好的本地上下文与lambdas,这样可以做出更多假设并执行更多优化。
答案 0 :(得分:163)
原因是lambda是函数对象,因此将它们传递给函数模板将实例化一个专门用于该对象的新函数。因此编译器可以简单地内联lambda调用。
另一方面,对于函数,旧的警告适用:函数指针被传递给函数模板,并且编译器传统上在通过函数指针调用调用方面存在很多问题。理论上它们可以内联,但前提是内联函数也是内联的。
例如,请考虑以下函数模板:
template <typename Iter, typename F>
void map(Iter begin, Iter end, F f) {
for (; begin != end; ++begin)
*begin = f(*begin);
}
用这样的lambda调用它:
int a[] = { 1, 2, 3, 4 };
map(begin(a), end(a), [](int n) { return n * 2; });
此实例化中的结果(由编译器创建):
template <>
void map<int*, _some_lambda_type>(int* begin, int* end, _some_lambda_type f) {
for (; begin != end; ++begin)
*begin = f.operator()(*begin);
}
...编译器知道_some_lambda_type::operator ()
并且可以简单地内联调用它。 (并且使用任何其他lambda调用函数map
将创建map
的新实例化,因为每个lambda具有不同的类型。)
但是当使用函数指针调用时,实例化如下所示:
template <>
void map<int*, int (*)(int)>(int* begin, int* end, int (*f)(int)) {
for (; begin != end; ++begin)
*begin = f(*begin);
}
...此处f
指向每个map
调用的不同地址,因此编译器无法内联对f
的调用,除非对map
的周围调用也有内联,以便编译器可以将f
解析为一个特定的函数。
答案 1 :(得分:24)
因为当你将“函数”传递给算法时,你实际上是在传递一个指向函数的指针,所以它必须通过指向函数的指针进行间接调用。当您使用lambda时,您将对象传递给专门为该类型实例化的模板实例,并且对lambda函数的调用是直接调用,而不是通过函数指针调用,因此更可能内联。
答案 2 :(得分:-1)
Lambda 不会比通常的函数更快或更慢。 如有错误请指正。
首先,lambda 和普通函数有什么区别:
让我们谈谈捕获。它不会为函数提供任何性能,因为编译器必须传递带有处理捕获所需的数据的附加对象。无论如何,如果您只是在适当的位置使用 lambda 函数,它将很容易优化。此外,如果 lambda 不使用捕获,您可以将 lambda 转换为函数指针。为什么?因为如果没有捕获就只是一个普通的函数。
void (*a1)() = []() {
// ...
};
void _tmp() {
// ...
}
void (*a2)() = _tmp;
以上两个例子都是有效的。
说到从目标文件中删除函数。您可以简单地将您的函数放入匿名命名空间,它就会达成交易。函数内联会更开心一点,因为它不会在除了文件之外的任何地方使用。
auto a1 = []() {
// ...
};
namespace {
auto a2() {
// ...
}
}
上述功能将与性能相同。
我还注意到函数指针和 lambdas 进行了比较。这不是一件好事,因为它们是不同的。当你有一个指向函数的指针时,它可以指向各种不同的函数,并且可以在运行时改变,因为它只是一个指向内存的指针。 Lambda 不能这样做。它总是只用一个函数运行,因为调用哪个函数的信息存储在类型本身中。
你可以用这样的函数指针编写代码:
void f1() {
// ...
}
void f2() {
// ...
}
int main() {
void (*a)();
a = f1;
a = f2;
}
完全没问题。并且您不能以这种方式使用 lambda 编写代码:
int main() {
auto f1 = []() {
// ...
};
auto f2 = []() {
// ...
};
f2 = f1; // error: no viable overloaded '='
}
如果某些库接受函数指针,并不意味着编译器可以比普通函数更好地优化 lambda,因为问题不在于公共库和函数指针。