为什么Rust中的对数比Java慢?

时间:2017-07-11 14:33:03

标签: java floating-point rust microbenchmark jmh

如果我在Rust中运行这些基准测试:

#[bench]
fn bench_rnd(b: &mut Bencher) {
    let mut rng = rand::weak_rng();
    b.iter(|| rng.gen_range::<f64>(2.0, 100.0));
}

#[bench]
fn bench_ln(b: &mut Bencher) {
    let mut rng = rand::weak_rng();
    b.iter(|| rng.gen_range::<f64>(2.0, 100.0).ln());
}

结果是:

test tests::bench_ln             ... bench:        121 ns/iter (+/- 2)
test tests::bench_rnd            ... bench:          6 ns/iter (+/- 0)

121-6 =每ln次呼叫115 ns。

但Java中的基准相同:

@State(Scope.Benchmark)
public static class Rnd {
    final double x = ThreadLocalRandom.current().nextDouble(2, 100);
}

@Benchmark
public double testLog(Rnd rnd) {
    return Math.log(rnd.x);
}

给我:

Benchmark    Mode Cnt  Score  Error Units
Main.testLog avgt  20 31,555 ± 0,234 ns/op

在Rust中,日志比在Java中慢约3.7倍(115/31)。

当我测试斜边实现(hypot)时,Rust中的实现比Java快15.8倍。

我是否写过不好的基准测试,或者这是性能问题?

回答评论中提出的问题:

  1. “,”是我国的小数点分隔符。

  2. 我使用cargo bench运行Rust的基准测试,它始终以发布模式运行。

  3. Java基准框架(JMH)为每个调用创建一个新对象,即使它是static类和final变量。如果我在测试方法中添加随机创建,我得到43 ns / op。

2 个答案:

答案 0 :(得分:7)

答案是given by @kennytm

export RUSTFLAGS='-Ctarget-cpu=native'

解决了这个问题。之后,结果如下:

test tests::bench_ln              ... bench:          43 ns/iter (+/- 3)
test tests::bench_rnd             ... bench:           5 ns/iter (+/- 0)

我认为38(±3)足够接近31.555(±0.234)。

答案 1 :(得分:6)

因为我不知道Rust,所以我将提供另外一半的解释。 Math.log注释为@HotSpotIntrinsicCandidate,意味着它将被用于此类操作的本机CPU指令替换:认为Integer.bitCount可以进行大量移位或使用直接CPU指令做得那么快。

有一个非常简单的程序:

public static void main(String[] args) {
    System.out.println(mathLn(20_000));
}

private static long mathLn(int x) {
    long result = 0L;
    for (int i = 0; i < x; ++i) {
        result = result + ln(i);
    }
    return result;
}

private static final long ln(int x) {
    return (long) Math.log(x);
}

运行它:

 java -XX:+UnlockDiagnosticVMOptions  
      -XX:+PrintInlining 
      -XX:+PrintIntrinsics 
      -XX:CICompilerCount=2 
      -XX:+PrintCompilation  
      package/Classname 

它会生成很多行,但其中一行是:

 @ 2   java.lang.Math::log (5 bytes)   intrinsic

使这段代码非常快。

我真的不知道什么时候以及如何在Rust中发生......