我写了一些基准测试来检查分别由Golang
和ANSI C
处理语句的速度。我试图保持相同的架构整体解决方案。
紧接着是 ANSI C 中的解决方案;
#include <stdlib.h>
#include <stdio.h>
#include <time.h>
void bench(void (*f)(int));
void if_func_1(int i);
void if_func_2(int i);
void if_func_3(int i);
int main() {
bench(&if_func_1);
bench(&if_func_2);
bench(&if_func_3);
return 0;
}
void bench(void (*f)(int)) {
int i;
struct timespec start, end;
float delta_us;
clock_gettime(CLOCK_MONOTONIC_RAW, &start);
for (i = 2147483647; -2147483648 != i; i--) {
(*f)(i);
}
clock_gettime(CLOCK_MONOTONIC_RAW, &end);
delta_us = (end.tv_sec - start.tv_sec) * 1000000 + (end.tv_nsec - start.tv_nsec) * 0.001;
printf("%.3fms\n", delta_us * 0.001);
}
void if_func_1(int i) {
if (0 == i) {
return;
}
if (1 == i) {
return;
}
if (2 == i) {
return;
}
if (3 == i) {
return;
}
return;
}
void if_func_2(int i) {
if (0 == i) {
return;
} else if (1 == i) {
return;
} else if (2 == i) {
return;
} else if (3 == i) {
return;
}
return;
}
void if_func_3(int i) {
if (0 == i || 1 == i || 2 == i || 3 == i) {
return;
}
return;
}
结果如下:
~ time ./app.bin
20875.278ms
28766.584ms
16371.974ms
./app.bin 65.59s user 0.09s system 99% cpu 1:06.02 total
正如我所期望的,if_func_3
是最快的,因为它实现了不同的逻辑。
在 Golang 中,我的解决方案如下:
package main
import (
"fmt"
"time"
)
func main() {
bench(if_func_1)
bench(if_func_2)
bench(if_func_3)
}
func bench(f func(int)) {
var i int = 0
start := time.Now();
for i = 2147483647; -2147483648 != i; i-- {
f(i)
}
elapsed := time.Since(start)
fmt.Println(elapsed)
}
func if_func_1(i int) {
if 0 == i {
return
}
if 1 == i {
return
}
if 2 == i {
return
}
if 3 == i {
return
}
return
}
func if_func_2(i int) {
if 0 == i {
return
} else if 1 == i {
return
} else if 2 == i {
return
} else if 3 == i {
return
}
return
}
func if_func_3(i int) {
if 0 == i || 1 == i || 2 == i || 3 == i {
return
}
return
}
我可以在这里使用指针,因为它们在Golang中不存在。
结果非常混乱。
~> time go run app.go
11.595459054s
13.062146816s
14.504122183s
go run app.go 39.33s user 0.34s system 92% cpu 42.746 total
是什么原因导致这两种解决方案出现这种差异?如何优化ANSI C
解决方案以使其表现更好?
环境规范
系统MacOS
gcc版本10.0.0
转到版本1.10.3
带有-ansi --pedantic -Wall
标志的编译。
添加-O
并更改平凡的return
以打印一些文本之后。总执行时间已更改。
对于ANSI C
From: System 99% cpu 1:06.02 total
To: System 99% cpu 8.552 total
对于Golang
From: system 98% cpu 43.634 total
To: system 92% cpu 42.746 total
答案 0 :(得分:4)
所有经过测试的功能都等同于void no_op(int) {}
。时序上的巨大差异是可能的,因为您没有进行优化就进行编译,这使基准测试结果充其量是可疑的。
正确的基准测试需要启用优化功能(例如,对于GCC和Clang,-O
或更高版本),并且要注意不要对相关部分进行优化。它看起来似乎是一个简单的问题,但是在实践中却常常令人惊讶。我建议使用基准测试库such as google benchmark,使问题更易于管理。
我看到您使用编译器版本和设置更新了您的问题,这是一件好事。与性能相关的问题往往具有或高度依赖于实现的答案,因此,此类问题中应始终包含此信息(就此而言,对于涉及测试程序的任何问题都不会造成伤害)。您还应该添加所用Golang的版本和开关。