我的问题陈述是使用数字加载和保存二进制文件,这些数字可以轻松存储在uint32/float32
中。磁盘上的空间将超过2GB,并且所有空间也都必须在内存上。
我的程序将需要大量数学运算,而golang标准库函数/方法则需要int/float64
参数,我必须将数字强制转换为int/float64
一个简单的基准(https://play.golang.org/p/A52-wBo3Z34)测试给出了以下输出:
$: go test -bench=.
goos: linux
goarch: amd64
pkg: gotrade
BenchmarkCast-4 1000 1519964 ns/op
BenchmarkNoCast-4 3000 373340 ns/op
PASS
ok gotrade 2.843s
这清楚地表明类型转换非常昂贵。
int和float64的缺点:
int和float64的优点:
请给我建议一种处理这种情况的方法,我在这里错过了什么吗?
如果我们需要通过标准库进行外部计算,我们应该总是选择int
和float64
吗?
答案 0 :(得分:3)
您在逻辑,基准和假设方面存在一些错误。
对于转换,结果显示for循环运行了1000次。由于您执行了1百万次循环,因此实际上进行了10亿次铸造操作...不太破旧。
实际上,我对您的代码做了一些修改:
const (
min = float64(math.SmallestNonzeroFloat32)
max = float64(math.MaxFloat32)
)
func cast(in float64) (out float32, err error) {
// We need to guard here, as casting from float64 to float32 looses precision
// Therefor, we might get out of scope.
if in < min {
return 0.00, fmt.Errorf("%f is smaller than smallest float32 (%f)", in, min)
} else if in > max {
return 0.00, fmt.Errorf("%f is bigger than biggest float32 (%f)", in, max)
}
return float32(in), nil
}
// multi64 uses a variadic in parameter, in order to be able
// to use the multiplication with arbitrary length.
func multi64(in ...float64) (result float32, err error) {
// Necessary to set it to 1.00, since float64's null value is 0.00...
im := float64(1.00)
for _, v := range in {
im = im * v
}
// We only need to cast once.
// You DO want to make the calculation with the original precision and only
// want to do the casting ONCE. However, this should not be done here - but in the
// caller, as the caller knows on how to deal with special cases.
return cast(im)
}
// multi32 is a rather non-sensical wrapper, since the for loop
// could easily be done in the caller.
// It is only here for comparison purposes.
func multi32(in ...float32) (result float32) {
result = 1.00
for _, v := range in {
result = result * v
}
return result
}
// openFile is here for comparison to show that you can do
// a... fantastic metric ton of castings in comparison to IO ops.
func openFile() error {
f, err := os.Open("cast.go")
if err != nil {
return fmt.Errorf("Error opening file")
}
defer f.Close()
br := bufio.NewReader(f)
if _, _, err := br.ReadLine(); err != nil {
return fmt.Errorf("Error reading line: %s", err)
}
return nil
}
使用以下测试代码
func init() {
rand.Seed(time.Now().UTC().UnixNano())
}
func BenchmarkCast(b *testing.B) {
b.StopTimer()
v := rand.Float64()
var err error
b.ResetTimer()
b.StartTimer()
for i := 0; i < b.N; i++ {
if _, err = cast(v); err != nil {
b.Fail()
}
}
}
func BenchmarkMulti32(b *testing.B) {
b.StopTimer()
vals := make([]float32, 10)
for i := 0; i < 10; i++ {
vals[i] = rand.Float32() * float32(i+1)
}
b.ResetTimer()
b.StartTimer()
for i := 0; i < b.N; i++ {
multi32(vals...)
}
}
func BenchmarkMulti64(b *testing.B) {
b.StopTimer()
vals := make([]float64, 10)
for i := 0; i < 10; i++ {
vals[i] = rand.Float64() * float64(i+1)
}
var err error
b.ResetTimer()
b.StartTimer()
for i := 0; i < b.N; i++ {
if _, err = multi64(vals...); err != nil {
b.Log(err)
b.Fail()
}
}
}
func BenchmarkOpenFile(b *testing.B) {
var err error
for i := 0; i < b.N; i++ {
if err = openFile(); err != nil {
b.Log(err)
b.Fail()
}
}
}
您会得到类似的东西
BenchmarkCast-4 1000000000 2.42 ns/op
BenchmarkMulti32-4 300000000 5.04 ns/op
BenchmarkMulti64-4 200000000 8.19 ns/op
BenchmarkOpenFile-4 100000 19591 ns/op
因此,即使使用了相对愚蠢且未经优化的代码,实施者还是openFile基准测试。
现在,让我们对此进行透视。 19,562ns等于0,019562毫秒。一般人可以感知到大约20毫秒的延迟。因此,即使有100,000(“十万” )个文件打开,行读取和文件关闭也比人类感知的速度快约1000倍。
铸造,相比之下,速度要快几个 个数量级 -因此,按您的喜好铸造,瓶颈将是I / O。
哪个留下了一个问题,为什么您不首先将值导入为float64?